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Continuation of Box 1.2 

Claims 13-15, 19-36 partly concern nucleic acid sequences promoting and/or regulating 
the expression of the SPG4 gene, as well as the corresponsing polypeptides, without 
providing therein a real technical characterisation. Said claims concern also nucleic acids 
and polypeptides derived from any other gene controlling SPG4, which is neither defined 
nor characterised in the description. Consequently, said claims are ambiguous and vague, 
and their subject matter is not sufficiently disclosed and supported in accordance with 
PCT Article 5 and 6. Consequently, it not possible to carry out any meaningful search for 
speculative claims whereof the subject matter consists merely of a list of results to be 
obtained in future. 



The applicant's attention is drawn to the fact that claims, or parts of claims, in respect of 
which no search report has been established need not be the subject of a preliminary 
examination report (PCT Rule 66. 1(e)). The applicant is advised that the line of conduct 
adopted by the EPO acting in its capacity as International Preliminary Examination 
Authority is not to proceed with an examination of a subject matter in respect of which no 
search has been carried out. Such an attitude will remain unchanged, notwithstanding 
whether the claims have been modified or not, either after the report has been received or 
during any procedure under Chapter II. 



Fonn PCT/ISA/210 (patent family annex) (July 1992) 



Copie a rintention de I'office designe (DO/US) 



PCT/FROO/02433; 



TRAIT t DE COOPERATION EN MATURE DE BREVETS 

Exp6diteur: le BUREAU INTERNATIONAL 



PCT 

NOTIFICATION DE L'ENREGISTREMENT 
D'UN CHANGEMENT 

{regie 92bis.1 et 
instruction administrative 422 du PCT) 


Destinataire: 

MARTIN, Jean-Jacques 
Cabinet Regimbeau 
20 rue de Chazelles 
F-75847 Paris 
FRANCE 


Date tf expedition (jour/mois/annee) 
, 26 a vri 12001 (26.04.01) 


Reference du dossier du deposant ou du mandataire 
341225/18374 


NOTIFICATION IMPORTANTE 


Demand© Internationale no 
PCT/FROG/02433 


Date du depot international (jour/mois/annee) 

04 septembre 2000 (04.09.00) / 



mm 



1. Us re nsefgne merits suivants eta lent enregistres en oe qui ooncerne: 
|~~| le deposant | [ I'inventeur ^] le mandataire le representant commun 


Nometadresse . . 

\ f MARTIN, Jean-Jacques 
^Cabinet Regimbeau. 
:-^%avenuelCI6ber 
^-751 16 Paris 
jJfRANCE 


Nationalrte (nom de VEtat) 


Domicile (nom de I'Etat) 


no de telephone 
01-45-00-92-02 


no de tel6copfeur 
01-45-00-46-12 


no de telelmprimeur 


2. Le Bureau International notifie au d6posant que le changement indiqu6 < 
r7] japersonne [""] lenom. [xl I'adresse \ 


si-apres a ete enregistr6 en ce qui ooncerne: 
| la nationalite | | Je domicile - , . 


% MARTIN, Jean-Jacques 
Cabinet Regimbeau 
20 rue de Chazelles 
F-75847 Paris 

FRANCE ^ 


Nationals (nom de I'Etat) 


Domicile' (nom deJ'Etat) 


no de telephone 
01-44-29-35-00 


no de teleoopieur 
01-44-29-35-99 


no de teleimprimeur 


3. Observations complementaires, le cas echeant: 


4. Une copie de cette notification a ete envoyee: 
[x] a I'office recepteur [3<] aux offices d6signes concernes 
| | d I'administration chargee de la recherche international© | [ aux offices 6lus concernes 
| | a I'administration chargee de I'examen preliminaire international | | autre destinataire: 


Bureau international de I'OMPI 
34, chemin des Colombettes 
121 1 Geneve 20, Suisse 

no de telecopies (41-22) 740.14.35 


Fonctionnaire autoris6: 

Jocelyne Rey-Millet 

no de telephone (41-22) 338.83.38 



Formulaire PCT/IB/306 (mars 1994) 



003989109 



PPT 


Dcinandc intcrnationale n 6 


REQUETE 


Date du depot international 


Le soussigne requicrl que la present c demande 
intcrnationale soit traitee conforniement an Traitc dc 
cooperation en inati6rc dc brevets. 


Nom dc T office rccepleur cl "'Demande interna tionalc PC I " 




Reference du dossier du deposant ou du mandatairc (Jacultatifi 
(1 2 caractcres an maximum) 34 1 22 5/ 1 8 3 74 


Cadre n" i tit RE D£ L invention OXNAffi, EXF^ESSICN ET CARACIH?ISAIICN HI GENE SPG4 
KhSKXiSABLE EE IA PCSME LA PLUS FRHJJENIE EE PARARHTTR SPASTEQUE AUTDBCMIQUE 


Cadre n° II D EPOS ANT 


No in el adressc : (Nom de farm lie atrvi du prenom; pour une personne. morale, designation 
oijic telle complete. L 'adr'esse doit comprendre le code postal el le nom du pays. Lepays de 
fadresse indtquce dans ce cadre est I 'Efat oh le deposant a son domtcde si aticun domicile 
n 'est indique ci-dessous.) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) 
3 Rue Michel-Ange 
75794 PARIS CEDEX 16 
FRANCE 


I I Ccttc personnc est aussi 
I ' jnventeur. 

n" dc telephone 
n" do tclccopkur 
n u de telcimprimeuj 


jbjijlionalitc {nom de I'Etal) : 


Domicile (nom de Lritat) : 
FR 


Ccttc personnc est 1 1 tous les Elats r^l tons, les foals dosi gnes sauf 1 | les £lats-t. : nis d'Amcnqtic j lies Elals indiqucs dans 

Hr po^m pour | | destines I A J ks Eutt5-Unis d'Ameriquc | | xeuleincnt | | k cadre supplcmeulairc 


Cadre III AUTRE(S) DEPOSANT(S) OU (AUTRE(S)) INVENT EUR(S) 


Nom et adressc : f-Yom de famille suivi dtt prenom; pour ime personue morale, designation 
offick'lle complete. L adr'esse doit comprendre le code postal et le nom du pays. Le pays dc 
fadresse indtquee dans ce cadre est I 'Efat oil le deposant a son domicile si a nam domicile 
n 'est indique ci-dessous.) 

WEISSENBACH Jean 
163 Rue de Vaugirard 
75015 PARIS 
FRANCE 


Ccttc personnc est : 

j | deposant sculcmcnt 

| | deposant el invent cur 

| | jnventeur sculcmcnt 
(Si cette cast est cochee, 
ne. pas remplir la suite.) 


Nationality (nom dc I Btat) 
FR 


Domicile (noin de I 'titan : 
FR 


Ccttc personnc est I I lous les l>lats f— 1 tousle* EtatadwisiKSsauf VZF\ les Ktais-Unis d'Aminqiw |— 1 [« Luu ^^ilS? 

deposant pour : 1 1 des i gnes 1 1 kslitats-Unisd Amcrique L*J sculcmcnt | 1 L culn. supplunuilair*. 


j Daulrcs deposanls ou inventcurs sont indiqucs sui unc fcuille annexe. 


Cadre n«* IV MAN DATA IRE OU REPRESENTANT COMMUN; OU ADRESSE POUR LA CORRESPON DANCE 


La personnc dont I id entile est donnec ci-dessous esfa etc designee pour agir ao nom du ou rTTl ma ndatatrc 1 1 rtprescntant com t nun 
des deposants aupres des aulc>riles in tenia lion ales compete n les, com me. LcJ 1 1 


Nom et adressc ' fVdw dt famille anivi du prenom: pour unc per. wane morale, designation ofjkielle 
complete. L adres.w doit comprendre le code poxlol et le nom du pays / 

MARTIN Jean-Jacques, SCHRIMPF Robert, AHNER Francis 

WARCOIN Jacques, TEXIER Christian, 

CABINET REGIMBEAU 

26 Avenue Kleber 

75116 PARIS 

FRANCE 


n" de telephone 

01 45 00 92 02 

ir* de lelecopieur 

01 45 00 46 12 

n* dc telcimpri incur 


| 1 Adressc pour la correspond mice : cochcr eeltc ease lorsquc aucun mandatajre ni icprescnlnnt commun n cstm a etc designe 

j | ct queVcspaec ci-dessus est utilise pour indiuuci unc adressc speciale a laquelle la corrcspondancc doit ctre envoyec. 



Formula ire PC T. R(> 101 ( premiere feuiHc) fjuillcl 1 998: reimpression janvicr 2000) I oir les notes relatives a u formula ire de requete 



Fcuillc n" 



Suite du cadre n° 111 AUTRE(S) DEPOSANT(S) OLf (AUTRE(S)) INVENTEl/R(S) 


Si uucun des sous-cadres suivants n 'est utilise, cette feuille ne doit pas etre incluse dans la requete. 


Nom ct adrcssc : (Nom de Jamil le suivi du prenom; pour line pcrsonnc morale, designation 
o/ftcielle complete. L adresse doit comprendre le coda postal ef le nom du pays. Le pays de 
I adresse indjqnee dans ce cadre est C£.'tat on le deposant a son domicile si attain aoinicde 
n esl indique ci-dessous J 

HAZAN Jamile 

22 Rue des Cordelieres 

75013 PARIS 

FRANCE 


Cettc pcrsonnc est : 

| \ deposant seulemcnt 

\)C\ deposant ct inventeur 

| | inventeur seulemcnf 
(Si cette cose est cochee. 
nc pas remplir la state.) 


Naiionahie (nom de TEtat) ; 
FR 


Domicile (nom de l"£tat) : 
FR 


Ccttc pcrsonnc est I | touslcs£<a(s j | tousles lit&is designs sauf njTl \ CH liiats-t/nis dVVmeriqitc* J 1 jfonls htdiques dsuis 
deposant pour : 1 1 designes i 1 les Etats-Unis d'Ameriqius Lt*J souiemeiit 1 1 !c oidrc supplement a ire 


Nom ct adrcssc: (Nom de famitte suivi du prenom: pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code, postal ef le nom du pays. Le pays de 
I 'adresse irtdiquee dans ce cadre est I Elat oil le deposant a son domicile si due tin domicile 
n 'est indique ci-c/essousj 


Ccttc pcrsonnc est : 

| | deposant settlement 

| | deposant ct inventeur 

| | inventeur settlement 
(Si cette case esl cochee, 
ne pas remplir In suite.) 


N3ticmaiilc (nom dc 1'Iilat) : 


Domicile (nom dc I tfat) : 


Cellc pcrsonnc est 1 1 tous les iitals 1 1 lous^es Elals designes saul" 1 1 les Etals-Unis d\Ajijeriqtte 1 1 les Etals indiques dans 

deposant pour : 1 | designcs | | ]cs ElaLs-L f nis d'Amerique | [settlement | | le cadre supplementaire 


Nom ct adresse . fNont de /ami lie suivi du prenom; pour une persona e i nor ale. designation 
officielle complete. L 'adresse doit comprendre le code postal Je nom du pavs. Le nays de 
f adresse indtquee dans ce cadre esi / 'Etat oil le. deposant a son domicile si due tin domicile 
n 'est indique a-dessous.) 


Ccttc pcrsonnc est : 

j | deposant settlement 

| | deposant ct inventeur 

| | inventeur settlement 

(Si cette case est cochee, 
ne pas remplir la suite.) 


Nat ionn lite (nom dc 1' 1:1 at) ; 


Domicile (nom dc Filial) : 


CYMc pcrsonnc est 1 1 tousles Elais 1 I tons les Llats designes saui" J | les Elaty-Ums d'Anieriquc j ) les tints itidiques dans 

dcposanl pour : 1 I desiencs |__J les Elals-Unis d'Amerique [__| settlement ( j le cadre supplementaire 


Nometadrcs.se: (Mom de jam die suivi du prenom; pour une pcrsonnc morale, designation 
ojjicielle complete. L 'adresse doit comprendre le. code postal el le nom du pays. Le pavs de 
1 adresse mdlquee dans ce. cadre, est 1 Etat oil le deposant a son domicile si aucun domicile 
n '«( indique ci-dessous.} 


Ccttc pcrsonnc est : 

| | deposant' settlement 

| | deposant ct inventeur 

| j inventeur settlement 
(Si cei re case est coc/iec, 
ne pas remplir la suite.) 


Nationality (nom dc liilat) : 


Domicile (nom dc I'Elat) : 


Ccttc pcrsonnc est r~ ~ j louslesLlats [ ] tousjes iitats designes sauf I - ~ 1 les Etuts-Ums d'Amerique T~ "~ 1 les Etals indiqoes dam 
dcposanl pour : 1 1 designer | J les Etats-l'nis d'Ametiqiic | | seulcmeul 1 1 le oadrc- supplemental 


| D'nutrcs deposants ou inventcurs sont mdiqucs stir unc autre fcuillc annexe. 



FoiniuUnre PCT'RO'101 (icuillc annexe) (juiliet 1 998: rcimpresskm janvicr 2000) Voir les notes relatives cut formal aire de. requete 



Fcuillc n* 3 



Cadre n° V DESIGNATION D' ETATS 



Los designations suivanies sont i'ailes conl'oiniemcm a la regie 4.9. a) (cocker les cases appropriees; mte au moms doit I etrc) : 
Brevet region nl 

□ AP Brevet AR1PO : GH Ghana. GM Onmbic, KE Kenya. LS Lesotho. MW Malawi, SD Soudan, SL Sierra Leone, 
SZ Swaziland, TZ Rcpubliquc-Unie dc Tanzania UC Ouganda, ZW Zimbabwe c( lout aulrc Elal qui est un Etat conlracfanl du 
Protocole de Harare ct du PCT 

Brevet curasien ; AM Armcnie, AZAzcrbaidjan. BY B6Iams. KCKirghizistan, KZ Kazakhstan, MD Rcpubliquc dc Moldova, 
RV Federation de Russie. TJ Tadjikistan. TM Turkmenistan ct tout autre fitet qui est un Etat coatractanf de la Convention sur 
1c brevel curasicn cl du PCT 

Brevet curopecn : AT Auirichc. BE Beigiquc, CH et LI Suisse ct Liechtenstein, CY Chyprc. DE Allemagne, 
DK Dancmark, ES Espagnc, FI Finlandc, FR France. GB Royaumc-Uni, CR Grecc, IE Jriandc, IT italic, 
LU Luxembourg. MC Monaco, NLPays-Bas, PT Portugal, SE Sucdc et lout autre Etat qui est un Etat eon tract ant de la 
Convention sur le brevel curopecn ct du PCT 
O OA Brevet OAP1 : BF Burkina Faso, BJ Benin, CF Rcpubliquc ccntral'ricaine, CG Congo, CI Cote d'l voire, 
CM Camcroun. GA Gabon, GN Guince, GW Quince-Bissau, ML Mali, MR Mauritania NE Niger, SN Senegal. 
TD Tchad, TG Togo el tout aulrc Etal qui est un Etat membrc dc FOAPl ct un Etat contraciant du PC T (si tine mitre forme 



□ EA 



0 EP 



de protection au de iraitement est soithaitee. le prsciser stir la ligne pointillee) 

Brevet national (si una autre forme de protection on de troitement est sonhaitie, le preciser stir ia ligne pointillee) : 



D AE Emirats arabes unis 

□ AL Albanic 

□ AM Armcnie 



□ AT 

□ AU 

□ AZ 

□ BA 

□ BB 

□ BG 

□ BR 

□ BY 
(3 CA 



Auirichc . 
Australie 
Azcrbaidjan 



□ 
□ 
□ 
□ 
□ 
□ 



LR 
LS 
LT 
LU 
LV 
MA 



Liberia 
Lesotho . . 
Lituanic 
Luxembourg 
Lctlonic 
Maroc . . . . 



Bosnic-Hej-zceovme CD MD Rcpubliquc de Moldova 



Barbadc 

Bulgarie 

Bresil 

Belarus O MN Mongolic 

Canada 



Q MG Madagascar 

O MK Ex-Republiquc yougoslave dc Maccdoine 



□ CH ct LI Suisse ci Liechtenstein 



□ MW Malawi , 

□ MX Mcxiquc 



□ CN 

□ CR 

□ CU 

□ CZ 

□ DE 

□ DK 



Chine □ NO Norvcge 



Cos la Rica 

Cuba 

Rcpubliquc (cheque 

Allemagne 

Daneniark 



Eslonic .... 
Espagnc . . . . 
Finlandc . . . 
Royaumc-Uni 
Grenade 
Gcorgic . . . 
Ghana . . . . 



D DM Dominique 

□ EE 

□ ES 

□ FI 

□ GB 

□ GD 

□ GE 

□ GH 

□ GM Gambic 

□ HR 

□ HU 

□ ID 

□ IL 

□ IN 

□ IS 
0 JP 

□ KE 



Croatic 



□ NZ 

□ PL 

□ PT 

□ RO 

□ RU 

□ SD 

□ SE 

□ KG 

□ SI 

□ SK 

□ SL 

□ TJ 

□ TM 

□ TR 

□ TT 



Nouvellc-Zclandc . . . 

Polognc 

Portugal 

Roumanic 

Federation de Russie 

Soudan 

Sucdc 

Singapour 

Slovcnic 

Siovaquic 

Sierra Lconc 

Tadjikistan 

Turkmenistan 

Turquic 

Tnnitc-cf-Tob3GQ . . . 



Hon&rie ED TZ Republiquc-Unie de Tanzanic 



Indonesie 
Israel 

Irule . . . 
Islandc 
Japon 



□ UA 

□ UG 
H US 



Ukraine 

Ouganda 

Etals-Unis d'Amcriquc 



□ UZ ^Uzbekistan 

Kenya □ VN Vict Nam 

□ KG Kirghizistan □ YU Yougoslavic 

□ KP Rcpubliquc populaiic democratique dc Corcc . □ ZA Al'riquc du Slid 

□ ZW Zimbabwe 

Cases reservecs pour la designation d'Etals qui sont devenus parties 

au PCT aprcs la publication dc la presents leu ilk- : 

□ DZ Aigerie LJMZ Mozambique 
|-j AG Antigua et Barbuda LlBZ Belize 

Declaration conccrnnnt les designations de precaution : outre les designations iaitcsei-dcsstis. 1c dcposanl fail aussi conformcmcnl 
a la reglc4.9.b) loutcs les designations qui sei aicnl autorisees cn veilu du PCT. a P exception de toutc designation indiquee dans le cadre 
supplemental connnc elant cxeluc dc la police dc cctlc declaration. Le dcposanl declare que ces designations additionncllcs sont 
taitcs sous reserv e dc confirmation cl que loulc designation qui n'esl pas conlirmce avant P expiration d'un dclai dc 15 moi.s a compter 
dc la date de priot ile doit clic const dcicc commc retiree par le deposant a 1" expiration dc cedelai. (Lu confirmation fy compris les taxes) 
doit parvenir a i 'office reccpteur dans le. dclai de J 5 mots.) 



D KR Rcpubliquc dc Corcc 

□ KZ Kazakhstan 

□ LC Saintc-Lucic 

□ LK Sri Lanka 



Formulairc PCT.RO/101 (deuxicmc fcuillc) (janvicr 2000) 



I 'oir les notes relatives ait formula ire de requete 



Fcuillc n° 



D'autrcs re vend j cations dc prioritc soni 
i n di go ccs dans lc cadre supple men tairc. 



Cadre n° VJ 



REVENDICATION DE PRIORITE 



□ 



(1) 



Date dc depot 
la demande antcricurc 
(jour' mot s' an nee) 

03/09/99 



Numcro 
dc la demande antcricurc 



99 11097 



Lorsquc la demande antcricurc est une : 



demande national? 
pays 

FRANCE 



demande regions lc :* 
office regional 



demande inicrnaiionalc 
officc rcccptcur 



(2> 



□ 



L r office rcccptcur est prie dc preparer ct de transmettre au Bureau international une copie certilice eon forme dc la ou des demandes 
anlcricurcs (settlement si la demande amcricure a ere deposee anpres de i 'office qui. attxjins de 

la pre. sente demande intcrnationale, est V office recepieur) indiquces ct-dessus au(x) poinl(s) : 



* .V/ la demande anterieure est une demande ARIVO. il c.xt obltgatoire d'lndiquer dant le cadre suppiementture au moms ntt payi partie a hi Convention 
de Paris pour la protection dc la proprme industnelle pour lequei ceuc demande anteneitre a etc aeposee (re°le ■fJO.bjiij). Voir le cadre supplemeniatre. 



Cadre n" Vll ADMINISTRATION CHARGEE DE LA RECHERCHE INTERNATIONALE 



Clioix de I 'administration chiirgee de la recherche 
intcrnntionnle (ISA) (si plusievrs administrations 
chargees de la recherche intcrnationale son! comp&tetttcs 
pour proceder a la recherche intcrnationale, inditptev 
I 'administration choisie: le code a deux letires pent etre 
utilise) . 

ISA/ EP 



Demande d 'utilisation des resultiits d'unc recherche anterieurc; mention dc 
cette recherche (si tine recherche anieriettre a ete ejfectuee par I 'administration 
chargee de la recherche intcrnationale ou demandee a cette dentiere) : 

Date (jottr/mois'amtee) Numcro Pays ton office regional) 



26 JUIN 2000 



FA 583429 



OEB 



Cntlre n' VIII BORDEREAU; LANGUE DE DEPOT 



La prescnte demande intcrnationale conticnl 
lc nombre dc feuillcs suivant - 



rcquctc : 

description (sauf partie rescrvec 
an lislage des sequences) 

revindications : 

abregc 

dessins : 

par tic de la description rescrvec 
an lisiage des sequences ; 

Nombre total de feuille.s 



44 
4 
1 
7 

57 



117 



Lc ou les elements coehes ci-apics sont joints a hi prescnte demande intcrnationale : 
1 . O fcuille dc calcul des taxes 

pouvoir distinct signc g SUiVI*6 ( 2 ) 

3. □ copie du pouvoir general; numcro de reference ; lc cas c eh cant : 

4. □ explication de 1" absence d'unc signature 

5. Q] documenl(s) de priori lc indiquc(s) dans lc cadre n" VI au(x) poinl(s) : 

6. □ traduction dc la demande intcrnationale en (langue) ; 

7. □ indications separccs conccrnant des micro-organismcs ou autre materiel 

biologiquc deposes 

8. 0 lislagc des sequences de nucleotides ou dacides amines sous forme 

dechiffrabtc par ordinateur 

9. O aulics elements tpreciser) : Copie du Rapport de Recherche 



Figure des dessins qui 
doit accornpagncr 1" abregc : 


Langue de depot dc la 

demande intcrnationale : FrsriQSIS 


Cudre n" IX SIGNATURE DU DEPOSANT OU DU MAN D AT AiR E 



WARCOIN Jacques 




28, Avenu® Ktefcer 
PARIS ?m®<X k 



./servc a Lfofffcc recepieur 



1 . Date effective de reception des pieces supposccs 
consiituer la deinandc intcrnationale : 



H. Dale effective dc reception, rccfifiee en raison dc la reception ultc- 
ricurc, mais dans les dclais. dc documents ou dc dessins eornpleiant cc 
qui est suppose consiituer la demande intcrnationale : 



4. Date dc reception, dans les dclais. des correelions 
demandecs scion Particle 1 1 .2) du PCT : 



2. Dessins : 
I | rccus : 

| | non rccus : 



5. Administration chargee de la recherche 
intcrnationale (si plusicurs sont compctenles) : 


ISA/ 




"□ 


Transmission de la conic dc recherche di fierce 
jusqirau paicment de la laxc dc recherche. 




Reserve au Bureau 






Date dc reception dc Pcxcmplairc 
original parlc (Bureau international : 









l-'ormutairc PCT/RO: 10 1 < dcrnicrc fcuillc) (juillct 1 998; rcimpi cssion janvicr 2000) I 'oir les notes relatives aufornndaire de. requcte 



TRAITE DE COOPERATION EN MATIERE DE BREVETS 

Expediteur: le BUREAU INTERNATIONAL 



WO 01/18198 
PCT/FROO/02433 



PCT 

AVIS INFORMANT LE DEPOSANT DE LA 

/^flltyihJII IM irATIHM np 1 A nPMAMnP 
UUIVllvlUIMICM 1 IKJvi Ut LA UtlVIMIM 

INTERNATIONALE AUX OFFICES DESIGNES 

(regie 47.1.c), premiere phrase, du PCT) 


Destinataire: 

MARTIN, Jean-Jacques 
Cabinet Regimbeau 
26, avenue Kleber 
F-751 1 6 Paris r 

r / j i iu rai 19 I ^ 

FRANCE J A R RMTeITfI 


Date d'expedition (jour/mois/annee) 

15 mars 2001 (15.03.01) 


Reference du dossier du deposant ou du mandataire 
341225/18374 


AVIS IMPORTANT 


Demande Internationale no 
PCT/FROO/02433 


Date du depot international (jour/mois/annee) 

04 septembre 2000 (04.09.00) 


Date de priorite (jour/mois/annee) 

03 septembre 1999 (03.09.99) 


Deposant 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) etc 



1. II est notifie par la presente qu'a la date indiquee ci-dessus comme date d'expedition de cet avis, le Bureau international a 
communique, comme le prevoit Particle 20, la demande international aux offices designes suivants: 

US 

Conformement a la regie 47.1.c), troisierne phrase, ces offices acceptent le present avis comme preuve determinate 
du fait que la communication de la demande Internationale a bien eu lieu a la date d'expedition indiquee plus haut, et le 
deposant n'est pas tenu de remettre de copie de la demande internationale a I'office ou aux offices designes. 

2. Les offices designes suivants ont renonce a I'exigence selon laquelle cette communication doit etre effectuee a cette date: 

CA,EP,JP 

La communication sera effectuee seulement sur demande de ces offices. De plus, le deposant n'est pas tenu de remettre 
de copie de la demande internationale aux offices en question (regie 49.1)a-bis)). 

3. Le present avis est accompagne d'une copie de la demande internationale publiee par le Bureau international le 
15 mars 2001 (1 5.03.01 ) sous le numero WO 01/18198 

RAPPEL CONCERNANT LE CHAPITRE II (article 31.2)a) et regie 54.2) 

Si le deposant souhaite reporter I'ouverture de la phase nationale jusqu'a 30 mois (ou plus pour ce qui concerne certains 
offices) a compter de la date de priorite, la demande d'examen preliminaire international doit etre presentee a 
I'administration competente chargee de I'examen pr6liminaire international avant ['expiration d'un delai de 19 mois a 
compter de la date de priorite. 

II appartient exclusivement au deposant de veiller au respect du delai de 19 mois. 

II est a noter que seul un deposant qui est ressortissant d'un Etat contractant du PCT lie par le chapitre M ou qui y a son 
domicile peut presenter une demande d'examen preliminaire international. 

RAPPEL CONCERNANT L'OUVERTURE DE LA PHASE NATIONALE (article 22 ou 39.1)) 

Si le deposant souhaite que la demande internationale procede en phase nationale, il doit, dans le delai de 20 mois ou 
de 30 mois, ou plus pour ce qui concerne certains offices, accomplir les actes mentionnes dans ces dispositions aupres 
de chaque office designe ou elu. 

Pour d'autres informations importantes concernant les delais et les actes a accomplir pour I'ouverture de la phase 
nationale, voir I'annexe du formulaire PCT/IB/301 (Notification de la reception de I'exemplaire original) et le volume II 
du Guide du deposant du PCT. 





Fonctionnaire autorise 




Bureau international de I'OMPI 






34, chemin des Colombettes 


J. Zahra 




1211 Geneve 20, Suisse 






no de telecopieur (41-22) 740.14.35 


no de telephone (41-22) 338.83.38 




Formulaire PCT/IB/308 Guillet 1996) 


3883359 



c 




Suite du formulaire PCT/IB/308 



WO 01/18198 
PCT/FR00/02433 



AVIS INFORMANT LE DEPOSANT DE LA COMMUNICATION DE 
LA DEMANDE INTERNATIONALE AUX OFFICES DESIGNES 



Date d'expedrtion (jour/mois/annee) 

15 mars 2001 (15.03.01) 


AVIS IMPORTANT 


Reference du dossier du deposant ou du mandataire 
341225/18374 


Demande internationale no 
PCT/FR00/02433 



II est notifie au deposant que, au moment de I'etablissement du present avis, le delai fixe a la regie 46.1 pour le depot de 
modifications selon Tarticle 19 n'etait pas encore expire et que le Bureau international n'avait pas recu de modications ni de 
declaration I'informant que le deposant ne souhaitait pas presenter de modifications. 



Formulaire PCT/IB/308 (feuille annexe) (juillet 1996) 



3883359 



TRAITE^E COOPERATION EN MATIE^ DE BREVETS 





Expediteur: le BUREAU INTERNATIONAL 


PCT 


Destinataire: 


NOTIFICATION DE LA RECEPTION DE -i 

L'EXEMPLAIRE ORIGINAj--^ \ 

(r&gle 24C5aT5< \ 


MARTIN, Jean-Jacques 
Cabinet Regimbeau 
26, avenue Kleber 
F-751 16 Paris 
y FRANCE 




Date d'expedrtion (j our/mo is/a nneeV**^"^ 

20 octobre 2000 (20.10.00) 


NOTIFICATION IMPORTANTE 


Reference du dossier du deposant ou du man data ire 
341225/18374 


Demande internationale no 
PCT/FR00/02433 



II est notifie au deposant que le Bureau international a recu I'exemplaire original de la demande internationale precisee 
ci-apres. 

Nom(s) du ou des deposants et de I'Etat ou des Etats pour lesquels ils sont deposants: 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) (pour tous les Etats 

designes sauf US) 
WEISSENBACH, Jean etc. (pour US seulement) 

Date du depot international : 04 septembre 2000 (04.09.00) 

Date(s) de priorite revendiquee(s) 03 septembre 1999 (03.09.99) 

Date de reception de i'exemplaire original 

par le Bureau international 03 OCtobre 2000 (03. 1 0.00) 

Liste des offices designes : 

EP :AT,BE,CH,CY,DE,DK,ES,FI,FR,GB,GRJE,IT,LU,MC,NL,PT,SE 
National :CA,JP,US 



ATTENTION 

Le deposant doit soigneusement verifier les indications figurant dans la presente notification. En cas de divergence entre ces 
indications et celles que contient la demande internationale, il doit aviser immediatement le Bureau international. 

En outre, ('attention du deposant est appelee sur les renseignements donnes dans ('annexe en ce qui concerne 



X 



les delais dans lesquels doit etre abordee la phase nationale 
| X [ la confirmation des designations faites par mesure de precaution 
| j les exigences relatives aux documents de priorite. 

Une copie de la presente notification est envoyee a I'office recepteur et a ('administration chargee de la recherche internationale. 





Fonctionnaire autorise ^^^^ 


Bureau international de I'OMPI 


34, chemin des Colombettes 


Jocelyne Rey-Millet A\n 


121 1 Geneve 20, Suisse 


n* detelecopieur (41-22) 740.14.35 


n de telephone (41-22) 338.83.38 



Formulaire PCT/IB/301 (juillet 1 998) 



003600287 



Demande internationale no 



5 



ANNEXED FORMULAIRE PCT/IB/301 ^ 

PCT/FR00/02433 



RENSEIGNEMENTS CONCERNANT LES DELAIS DANS LESQUELS DOIT ETRE ABORDEE 

LA PHASE NATIONALE 



II est rappele au deposant qu'il doit aborder la ''phase nationale" aupres de chacun des offices designes indiques sur la 
notification de la reception de I'exemplaire original (formulaire PCT/IB/301) en payant les taxes nationaies et en remettant les 
traductions, telles qu'elles sont prescrites par les legislations nationaies. 

Le delai d'accompltssement de ces actes de procedure est de 20 MOIS a compter dela date de priorite ou, pour les Etats 
designes qui ont ete elus par le deposant dans une demande d'examen preliminaire international ou dans une election ulterieure, 
de 30 MOIS a compter de la date de priorite, a condition que cette electionait ete effectuee avant ("expiration du 19e mois a 
compter de la date de priorite. Certains offices designes (ou elus) ont fixe des delais qui expirent au-dela de 20 ou 30 mois a 
compter de la date de priorite. D'autres offices accordent une prolongation des delais ou un delai de grace, dans certains cas 
moyennant le paiement d'une taxe supplementaire. 

En plus de ces actes de procedure, le deposant devra dans certains cas satisfaire a d'autres exigences particulieres 
applicables dans certains offices. II appartient au deposant de veiller a remplir en temps voulu les conditions requises pour 
I'ouverture de la phase nationale. La majorite des offices designes n'envoient pas de rappel a I'approche de la date limtte pour 
aborder la phase nationale. 

Des informations detail lees concern ant les actes de procedure a accomplir pour aborder la phase nationale aupres de 
chaque office designe, les delais applicables et la possibility d'obtenir une prolongation des delais ou un delai de grace ettoutes 
autres conditions applicables fig u rent dans le volume II du Guide du deposant du PCT. Les exigences concernant le depot d'une 
demande d'examen preliminaire international sont exposees dans le chapitre IX du volume I du Guide du deposant du PCT. 

GR et ES sont devenues liees par le chapitre II du PCT le 7 septembre 1996 et le 6 septembrel 997, respectivement, et 
peuvent done etre elues dans une demande d'examen preliminaire international ou dans une election ulterieure presentee le 7 
septembre 1996 (ou a une date posterieure) ou le 6 septembre 1997 (ou a une date posterieure), respectivement, quelle que soit 
la date de depot de la demande internationale (voir le second paragraphe, ci-dessus). 

Veuitlez noter que seul un deposant qui est ressortissant d'un Etat contractant du PCT lie par le chapitre II ou qui y a 
son domicile peut presenter une demande d'examen preliminaire international. 



CONFIRMATION DES DESIGNATIONS FAITES PAR MESURE DE PRECAUTION 



Seules les designations expresses faites dans la requete conformement a la regie 4. 9. a) figurent dans la presente 
notification. II est important de verifier si ces designations ont ete faites correctement. Des erreurs dans les designations peuvent 
etre corrigees lorsque des designations ont ete faites par mesure de precaution en vertu de la regie 4.9.b). Toute designation 
ainsi faite peut etre confirmee conformement aux dispositions de la regie 4.9.c) avant I'expiration d'un delai de 15 mois a 
compter de la date de priorite. En I'absence de confirmation, une designation faite par mesure de precaution sera consideree 
comme retiree par le deposant. II ne sera adresse aucun rappel ni invitation. Pour confirmer une designation , il faut deposer une 
declaration precisant I'Etat designe concerne (avec ['indication de la forme de protection ou de traitement souhaitee) et payer les 
taxes de designation et de confirmation. La confirmation doit parvenir a I'office recepteur dans le delai de 15 mois. 



EXIGENCES RELATIVES AUX DOCUMENTS DE PRIORITE 



Pour les deposants qui n'ont pas encore satisfait aux exigences relatives aux documents de priorite, il est rappele ce qui 

suit. 

Lorsque la priorite d'une demande nationale, regionale ou internationale anterieure est revendiquee, le deposant doit 
presenter une copie de cette demande anterieure, certifiee conforme par I'administration aupres de laquelle elle a ete deposee 
("document de priorite"), a I'office recepteur (qui la transmettra au Bureau international) ou directement au Bureau international, 
avant I'expiration d'un delai de 16 mois a compter de la date de priorite, etant entendu que tout document de priorite peut etre 
presente au Bureau international avant la date de publication de la demande internationale, auque! cas ce document sera repute 
avoir ete regu par le Bureau international le dernier jour du delai de 16 mois (regie 17.1.a)). 

Lorsque le document de priorite est delivre par I'office recepteur, le deposant peut, au lieu de presenter ce document, 
demandera I'office recepteur de le preparer et de le transmettre au Bureau international. La requete a cet effet doit etre 
formulee avant I'expiration du delai de 16 mots et peut etre soumise au paiement d'une taxe (regie 17.1. b)). 

Si le document de priorite en question n'est pas fourni au Bureau international, ou si la demande adressee a I'office recepteur 
de preparer et de transmettre le document de priorite n'a pas ete faite (et la taxe correspondante acquittee, le cas echeant) 
avant I'expiration du delai applicable mentionne aux paragraphes precedents, tout Etat designe peut ne pas tenir compte 
de la revendication de priorite; toutefois, aucun office designe ne peut decider de ne pas tenir compte de la revendication de 
priorite avant d'avoir donne au deposant la possibility de remettre le document de priorite dans un delai raisonnable en I'espece. 

Lorsque plusieurs priorites sont revendiquees, la date de priorite a prendre en consideration aux fins du calcul du delai de 
16 mois est la date du depot de la demande la plus ancienne dont la priorite est revendiquee. 



Formulaire PCT/IB/301 (annexe) (juillet 1 998) 



003600287 



TRAIT 



COOPERATION EN MATI 



DE BREVETS 



Expediteur : le BUREAU INTERNATIONAL 



PCT 

NOTIFICATION RELATIVE 
A LA PRESENTATION OU A LA TRANSMISSION 
DU DOCUMENT DE PRIORITE 

(instruction administrative 41 1 du PCT) 


Destinataire: 

MARTIN, Jean-Jacques 
Cabinet Regimbeau 

2fi avpnitp Klphpr 

*-\} t UVCIIUU IXICUCI 

F-75116 Paris 
FRANCE 


Date d'expedition (jour/mois/annee) 

20 octobre 2000 (20.10.00) 




Reference du dossier du deposant ou du mandataire 
341225/18374 


NOTIFICATION IMPORTANTE 


Demande internationale no 
PCT/FR00/02433 


Date du depot international (jour/mois/annee) 
04 septembre 2000 (04.09.00) 


Date de publication internationale (jour/mois/annee) 

Pas encore publiee 


Date de priorite (jour/mois/annee) 

03 septembre 1999 (03.09.99) 


Deposant 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) etc 



2. 



3. 



4. 



La date de reception (sauf lorsque les iettres "NR" figurent dans fa colonne de droite) par le Bureau international du ou des 
documents de priorite correspondant a la ou aux demandes enumerees ci-apres est notifree au deposant. Sauf indication 
contraire consistant en un asterisque figurant a cote d'une date de reception, ou les Iettres "NR", dans la colonne de droite, 
le document de priorite en question a ete presente ou transmis au Bureau international d'une maniere conforme a la 
regie 17.1. a) ou b). 

Ce formulaire met a jour et remplace toute notification relative a la presentation ou a la transmission du document de priorite 
qui a ete envoyee precedemment 

Un asterisque(*) figurant h. cote d'une date de reception dans la colonne de droite signale un document de priorite presente 
ou transmis au Bureau international mats de maniere non conforme a la regie 17.1. a) ou b). Dans ce cas, I'attention du 
deposant est appelee sur la regie 17.1.c) qui stipule qu'aucun office designe ne peut decider de ne pas tenir compte de la 
revendicatton de priorite avant d'avoir donne au deposant la possibility de remettre ie document de priorite dans un delai 
raisonnable en I'espece. 

Les Iettres "NR" figurant dans la colonne de droite signalent un document de priorite que le Bureau international n'a pas 
recu ou que le deposant n'a pas demande a Toffice recepteur de preparer et de transmettre au Bureau international, 
conformement a la regie 17.1. a) ou b), respecttvement. Dans ce cas, I'attention du deposant est appelee sur la regie 17.1.c) 
qui stipule qu'aucun office designe ne peut decider de ne pas tenir compte de la revendication de priorite avant d'avoir donne 
au deposant la possibility de remettre le document de priorite dans un delai raisonnable en I'espece. 



Date de priorite 



Demande de priorite n 



03 sept 1999 (03.09.99) 99/1 1097 



Pays, office regional ou 
office recepteur selon le PCT 

FR 



Date de reception du 
document de priorite 

03 octo 2000 (03.10.00) 





Bureau international de I'OMPI 
34, chemin des Colombettes 
1211 Geneve 20, Suisse 

no de telecopies (41-22) 740.14.35 


Fonctionnaire autorise: ^ 
Jocelyne Rey-Mil!et 

no de telephone (41 -22) 338.83.38 ^ 



Formulaire PCT/IB/304 (juillet 1998) 



003600288 



TRAITE DETOOPERATION EN M ATI ERE DE 

PCT 



VETS 



RAPPORT DE RECHERCHE INTERNATIONALE 
(article 18 et regies 43 et 44 du PCT) 



Reference du dossier du deposant ou 
du mandataire 

341225/18374 


POUR SUITE voir la notification de transmission du rapport de recherche internationale 
{formula ire PCT/IS A/220) et, le cas echeant, le point 5 ci-apres 

A DONNER 


Demande international e n* 

PCT/FR 00/02433 


Date du depot intemationalftour/mo/s/annee,) 

04/09/2000 


(Date de priorite (la plus ancienne) 
(jour/mois/annee) 

03/09/1999 


Deposant 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS 



Le present rapport de recherche internationale, etabli par ('administration chargee de la recherche internationale, est transmis au 
deposant conformement a ('article 18. Une copie en est transmise au Bureau international. 



. feuiiles. 



Ce rapport de recherche internationale comprend 3 

[X| II est aussi accompagne d'une copie de chaque document relatif a I'etat de la technique qui y est cite. 



1 . Base du rapport 

a. En ce qui concerne la langue, la recherche internationale a ete effectuee sur la base de la demande internationale dans la 
langue dans laquelle elle a ete deposee, sauf indication contraire don nee sous le meme point. 

| | la recherche internationale a ete effectuee sur la base d'une traduction de la demande internationale remise a ('administration. 

b. En ce qui concerne les sequences de nucleotides ou d'acides amines divulguees dans la demande internationale (le cas echeant), 
la recherche internationale a ete effectuee sur la base du listage des sequences : 

[X| contenu dans la demande internationale, sous forme ecrite. 

[X] deposee avec la demande internationale, sous forme dechiffrable par ordinateur. 

| | remis ulterieurement a I'administration, sous forme ecrite. 

| | remis ulterieurement a I'administration, sous forme dechiffrable par ordinateur. 

I | La declaration, selon laquelle le listage des sequences presente par ecrit et fourni ulterieurement ne vas pas au-dela de la 
divulgation faite dans la demande telle que deposee, a ete fourni e. 

| | La declaration, selon laquelle les informations enregistrees sous forme dechiffrable par ordinateur sont identiques a celles 
du listage des sequences presente par ecrit, a ete fournie. 



2. 
3. 



[X| II a ete estime que certaines revendications ne pouvaient pas faire I'objet d'une recherche (voir le cadre I). 
| | II y a absence d'unite de ('invention (voir le cadre II). 



4. En ce qui concerne le titre, 

[X] le texte est approuve tel qu'il a ete remis par le deposant. 

| | Le texte a ete etabli par I'administration et a la teneur suivante: 



5. En ce qui concerne I'abrege, 

le texte est approuve tel qu'il a ete remis par le deposant 

□ le texte (reproduit dans le cadre III) a ete etabli par I'administration conformement a la regie 38.2b). Le deposant peut 
presenter des observations a I'administration dans un delai d'un mois a compter de la date d'expedition du present rapport 
de recherche internationale. 

6. La figure des dessins a publier avec I'abrege est la Figure n° 



I | suggeree par le deposant. [X] Aucune des figures 

| | parce que le deposant n'a pas suggere de figure. n est & P ublier - 

| | parce que cette figure caracterise mieux I'invention. 



Formulaire PCT/ISA/210 (premiere feuille) (juillet 1998) 



Demande Internationale No. PCTvfR 00 #2433 



SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



Suite du cadre 1.2 



Les revendications 13-15,19-36 concernent en partie des sequences 
d'acides nucleiques promotrices et/ou regulatrices de Texpression du 
gene SPG4 , ainsi que des polypeptides correspondants , sans y donner une 
veritable characterisation technique. Ces revendications comprennent 
done aussi des nucleiques et polypeptides derives de tout autre gene 
controllant SPG4, ce qui n'est ni defini ni characterise dans la 
description. En consequence, ces revendications sont ambigues et vagues, 
et leur sujet-matiere n'est pas suff isamment decrit et demontre en accord 
avec les Articles 5 et 6 TCP. Aucune recherche ne peut etre etablie pour 
des revendications speculatives dont l'objet ne serait qu'une simple 
liste de resultats a obtenir dans le futur. 

L'attention du deposant est attiree sur le fait que les revendications, 
ou des parties de revendications, ayant trait aux inventions pour 
lesquelles aucun rapport de recherche n'a ete etabli ne peuvent faire 
obligatoirement l'objet d'un rapport preliminaire d'examen (Regie 66.1(e) 
PCT). Le deposant est averti que la ligne de conduite adoptee par TOEB 
agissant en qualite d* administration chargee de 1'examen preliminaire 
international est, normalement , de ne pas proceder a un examen 
preliminaire sur un sujet n'ayant pas fait l'objet d'une recherche. Cette 
attitude restera inchangee, independamment du fait que les revendications 
aient ou n'aient pas ete modifiees, soit apres la reception du rapport de 
recherche, soit pendant une quelconque procedure sous le Chapitre II. 



RAPPORT DE R^^ERCHE INTERNATIONALE 



iande Internationale No 

PCT/FR 00/02433 



A. GLASSEMENT DE L'OBJET OE LA DEMANDE 

CIB 7 C12N15/12 C12N5/10 C07K14/47 C07K16/18 C12Q1/68 
G01N33/50 A01K67/027 



Selon la classification inlernationale des brevets (CIB) ou a la fois selon la classification nationale et la CIB 

B. DQMAINES SUR LESQUELS LA RECHERCHE A PORTE 

Documentation minimale consult ee (systeme de classification suivi des symboles de ciassement) 

CIB 7 C12N C07K A01K G01N C12Q 



Documentation consultee autre que la documentation minimale dans la mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 



Base de donnees electron ique consullee au cours de la recherche internationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 

EMBL, STRAND, BIOSIS 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 0 Identification des documents cites, avec, le cas echeant, r indication des passages pertinents 



no. des revendications visees 



KIKUNO R. ET AL. : "Prediction of the 
coding sequences of unidentfied human 
genes. XIV. The complete sequences of 100 
cDNA clones from brain which code for 
large proteins in vitro." 
DNA RES. , 

vol. 6, 30 juin 1999 (1999-06-30), pages 

197-205, XP000852618 

le document en entier 

-& DATABASE EMBL <en ligne! 

Accession No. AB029006, 

4 aout 1999 (1999-08-04) 

0HARA 0.: "Homo sapiens mRNA for KIAA1083 

protein" 

XP002140994 

le document en entier 

-/-- 



1,4,5, 
14,16, 
18-21, 
24-30 



j )( j Voir la suite du cadre C pour la fin de la liste des documents 



□ 



Les documents de families de brevets sont indiques en annexe 



• Categories speciales de documents cites: 

*A* document defintssant I'etat general de la technique, non 
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— (54) Title: CLONING, EXPRESSION AND CHARACTERISATION OF THE SPG4 GENE RESPONSIBLE FOR THE MOST 
== FREQUENT FORM OF AUTOSOMAL SPASTIC PARAPLEGIA 

(54) Titre: CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RES PON SABLE DE LA FORME LA PLUS 
FREQUENC E DE PARAPLEGIE SPASTIQUE AUTOSOMIQUE DOMINANTE 

^ (57) Abstract: The invention concerns the identification and characterisation of the SPG4 gene coding for spastin, and some mu- 
tations thereof responsible for the most frequent form of autosomal dominant familial spastic paraplegia, the cloning and the Char- 
on acterisation of its cDNA and the corresponding polypeptides. The invention also concerns vectors, transformed cells and transgenic 
H animals as well as diagnostic methods and kits, and methods for selecting a chemical or biological compound capable of directly or 
0C indirectly interacting with said polypeptide. 

(57) Abreg& L'invention conceme 1' identification et la caractensation du gene SPG4 codant pour la spastin, et certaines de ses 
mutations responsables de la forme la plus frequente de paraplegie spastique familiale (PSF) autosomique dominante, le clonage et 

Q la caractensation de son ADNc ainsi que les polypeptides correspondants. L'invention conceme egalement des vecteurs, des cellules 
transformers et des animaux treansgeniques ainsi que des mdthodes et trousses de diagnostic, et des m&hodes de selection d'un 

^ compost chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention. 
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CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 
RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE 
SPASTIQUE AUTOSOMIQUE DOMINANTE. 

5 L'invention conceme I'identification et la caracterisation du gene SPG4 codant 

pour la spastin, responsable de la forme la plus frequente de paraplegia spastique 
famtliale (PSF) autosomique dominante, le clonage et la caracterisation de son ADNc 
ainsi que les polypeptides correspondants. L'invention conceme egalement des 
vecteurs, des cellules transformees et des animaux transgeniques ainsi que des 

10 methodes et trousses de diagnostic, et des methodes de selection d'un compose 
chimique ou biochimique capable d'interagir directement ou indirectement avec un 
polypeptide selon l'invention. 

Les paraplegies spastiques familiales (PSF) sont des affections degeneratives 
du systeme nerveux central caracterisees par une spasticite bilaterale et progressive 

15 des membres inferieurs. Elles se manifestent cliniquement par des difficultes de la 
marche pouvant evoluer en une paralysie totale des deux jambes. La physiopathologie 
de cet ensemble de maladies est a ce jour peu documentee ; toutefois, les donnees 
anatomopathologiques permettent de conclure que I'atteinte est limitee aux faisceaux 
pyramidaux responsables de la motricite volontaire dans la moefle epiniere (Reid, 

20 1997^. N existe differentes formes cliniques et genetiques de PSF. On distingue 
cliniquement les PSF dites « pures » correspondant a une spasticite isolee des 
membres inferieurs, des PSF « complexes » pour lesquelles la spasticite des jambes 
est associee a d'autres manifestations cliniques de type neurologique ou non (Bruyn et 
al., 1991). D'un point de vue genetique, les PSF peuvent etre transmises selon le 

25 mode autosomique dominant (PSF-AD), autosomique recessif (PSF-AR) ou lie au 
chromosome X (PSF-X). La forme « pure » de PSF qui est le plus souvent transmise 
selon le mode autosomique dominant demeure la plus frequente (environ 80 % des 
PSF) (Reid, 1997). L'incidence des PSF qui reste difficile a estimer en raison des rares 
etudes epidemiologiques et de J'importante variabilite clinique varie de 0,9 : 100 000 au 

30 Danemark, 3 a 9,6 : 100 000 dans certaines regions d*Espagne (Polo et al.,1991) ou 
14 : 100 000 en Norvege (Skre, 1974) (environ 3 : 100 000 en France). 

En plus de cette grande variabilite clinique qui est observee non seulement 
entre les differentes families mais aussi entre differents membres atteints d'une meme 
famille, I s PSF se caracterisent egalement par une importante heterog ' neite 

35 genetique. Dans fe cas des PSF-AD, quatre lod ont ete identifies a ce jour sur fes 
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chromosomes 14 (locus SPG3) (Hazan et aL, 1993), 2 (locus SPG4) (Hazan et al., 
1994 ; Hentali et al., 1994). 15 (locus SPG6) (Fink et aL, 1995) et 8 (locus SPG8) 
(Hedera et aL, 1999). L'etude d'un grand nombre de families presentant une PSF-AD a 
montre que le gene porte par le chromosome 2 est un locus majoritaire de cette forme 
5 de la maladie, retrouve dans 40 a 50 % des families analysees (The Hereditary Spastic 
Paraplegia Working Group, 1996 ; Durr et aL, 1996). Un phenomene d'anticipation a 
ete observe dans certaines families de PSF Nee au locus SPG4 ; ce phenomene a par 
la suite ete associe a ('expansion d'une repetition (CAG)n mise en evidence dans 6 
families danoises (Nielsen et aL, 1997) par la technique de RED (pour Rapid 

10 Expansion Detection). Cette expansion n'a cependant jamais pu etre confirmee dans 
aucune des families testees par cette meme methode ni par la recherche systematique 
de sequences de type (CAG)n dans les cartes physiques composees de clones YAC 
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) 
(Hazan et aL, Genomics, 60 (3), 309-19, 1999). 

15 A ce jour, trois genes responsables de deux formes de PSF-X et d'une forme 

de PSF-AR ont ete identifies. Des mutations dans le gene, codant pour une molecule 
d'adherence cellulatre specifique des neurones, L1-CAM (pour L1 Cell Adhesion 
Molecule), et localise en Xq28 (locus SPG1) causent une forme complexe de PSF 
(Jouet et aL, 1994) dans laquelle la spasticity est associee a un retard mental, alors 

20 que des mutations dans le gene PLP (pour ProteoLipid Protein) situe en Xq21 (locus 
SPG2), codant pour une molecule constitutive de la couche de myeline, sont a Porigine 
de formes pures et complexes de PSF-X (Saugier-Veber, P. et aL, 1994). Plus 
recemment des mutations dans un gene localise en 16q24.3 (locus SPG7), qui code 
pour la paraplegin, une ATPase mitochondriale de la famille proteique des AAA (pour 

25 «ATPases Associated with diverse cellular Activities») (Confalonieri et aL, 1995) ont 
ete associSes a des formes complexes et pures de PSF-AR (Casari et al., 1998). 

Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caracteriser le gene 
responsable de la forme la plus fr^quente de PSF-AD. ^identification de ce gene 
devrait en particulier permettre, outre la possibility d'un test de depistage antenatal 

30 chez les families concernees, de mieux comprendre certains des mecanismes 
moleculaires engendrant ces degenerescences specifiques de faisceaux nerveux de la 
moetle epiniere, voire d'apporter des elements de reponse quant a un traitement 
therapeutique des ma lades. 

Ceci est just ment I'objet de la presente invention. 
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Apres avoir delimits I'intervalle de localisation entre les marqueurs genetiques 
D2S352 t D2S2347 par I'etude des evenements de recombinaison dans les families 
de PSF liees au locus SPG4, les inventeurs ont etabli un contig de BACs recouvrant 
une distance physique evaluee a environ 1,5 Mb et entrepris une strategic de clonage 
5 positionnel basee sur le sequencage de I'intervalle SPG4 afin d'identifier de facon 
exhaustive tous les genes localises dans la region candidate. L'analyse de la sequence 
des deux BACs, D (b336P14) et G (B763N4), a revele la presence d'un gene compose 
de 17 exons, s'etendant sur une distance d'environ 100 kb, et presentant une 
homologie avec les genes codant pour des proteines de la famiile des AAA. La 
10 comparaison de la sequence de ce gene entre les individus sains et atteints des 
families de PSF-AD a permis de mettre en evidence differentes mutations chez les 
patients. 

L'invention a ainsi pour objet identification et la caracterisation du gene SPG4 
(ou SPAST) codant pour un nouveau membre nucleaire de la famiile des AAA, 
15 responsable de la forme la plus frequente de PSF-AD. 

Sous un premier aspect, la presente invention a pour objet un acide nucleique 
purifie ou isole du gene SPG4, caracterise en ce qu'il comprend au moins 15 
nucleotides consecutifs, de preference 20, 25, 30, 35, 40, 45, 50, 75, 100 ou 200 
nucleotides consecutifs, d'une sequence choisie parmi le groupe comprenant : 
20 - la sequence SEQ ID No. 1, sequence genomique du gene SPG4 humain ; 

- les sequences nucleiques homologues ou variantes de I'acide nucleique de sequence 
SEQ ID No. 1 ; 

- leur sequence complementaire ; et 

- la sequence de leur ARN correspondant. 

25 La presente invention conceme, bien entendu, aussi bien les sequences ADN 

qu'ARN ainsi que les sequences qui s'hybrident avec elles, de meme que les ADNs 
double brin correspondents. 

Par acide nucleique, sequence nucleique ou d'acide nucleique, polynucleotide, 
oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui 

30 seront employes indifferemment dans la presente description, on entendra designer 
aussi bien un ADN double brin, un ADN simple brin que des produits de transcription 
desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isoles, ou de 
synthese, comportant ou non des nucleotides non naturels, designant un 
enchaTnement precis de nucleotid s, modifies ou non, permettant de definir un 

35 fragment ou une region d'un acid nucleique. On entend par fragment d'ADN et/ou 
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d'ARN naturel isole, ou de synthese, comportant ou non des nucleotides non naturels, 
un enchainement precis de nucleotides, modifies ou non, permettant de definir un 
fragment, un segment ou une region d'un acide nucleique. 

II doit etre compris que la presente invention ne conceme pas les sequences 
5 nucleotidiques genomiques dans leur environnement chromosomique naturel, c'est-a- 
dire a I'etat naturel. II s'agit de sequences qui ont ete isolees et/ou purrfiees, c'est-a- 
dire qu'elles ont ete prelevees directement ou indirectement, par exemple par copie, 
leur environnement ayant ete au moins partiellement modifie. 

Par «sequence nucleique homoIogue», on entendra designer les sequences 

10 nucleiques presentant, par rapport a la sequence nucleique de reference certaines 
modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique, et/ou une mutation, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 80 %, de preference 90 % ou 95 %, d'identite apres 
alignement avec la sequence nucleique de reference. 

15 Par « pourcentage d'identite » entre deux sequences d'acide nucleique ou 

d'acides amines au sens de la presente invention, on entend designer un pourcentage 
de nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 

20 toute leur longueur. Les comparaisons de sequences entre deux sequences d'acide 
nucleique ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de man i ere optimale, ladite comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 
regions locales de similarite de sequence. L'alignement optimal des sequences pour la 

25 comparaison peut etre realise, outre manuellement, au moyen de ralgorithme 
d'homologie locale de Smith et Waterman (1981) {Ad. App. Math. 2:482], au moyen de 
I'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol. 48:443], 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988) 
[Proc. Nati. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces 

30 algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software 
Package, Genetics Computer Group, 575 Science Dr., Madison, Wl, ou encore par les 
logiciels de comparaison BLAST N ou BLAST P). 

Le pourcentage d'identite entre deux sequences d'acide nucleique ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere 

35 optimale par fenetre de comparaison dans laquelle la region de la sequence d'acide 
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nucleique ou decides amines a comparer peut comprehdre des additions ou des 
deletions par rapport a la sequence de reference pour un alignement optimal entre ces 
deux sequences. Le pourcentage d'identite est calcule en determinant le nombre de 
positions identiques pour lesquelles le nucleotide ou le residu d'acide amine est 
5 identique entre les deux sequences, en divisant ce nombre de positions identiques par 
le nombre total de positions dans la fenetre de comparaison et en multipliant le resultat 
obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par exernple, on pourra utilise r le programme BLAST, « BLAST 2 sequences » 
(Tatusova et al., "Blast 2 sequences - a new tool for comparing protein and nucleotide 
10 sequences", FEMS Microbiol. Lett. 174:247-250) disponible sur le site 
http://www.ncbi.nlm.nih.gov/gorf/bl2.html . les parametres utilises etant ceux donnes par 
defaut (en particulier pour les parametres « open gap penaltie » : 5, et « extension gap 
penaltie » : 2 ; la matrice choisie etant par exernple la matrice « BLOSUM 62 » 
proposee par le programme), le pourcentage d'identite entre les deux sequences a 
1 5 comparer etant calcule directement par le programme. 

II s'agit de preference de sequences dont les sequences complementaires sont 
susceptibles de s'hybrider specifiquement avec une des sequences de I'invention. De 
preference, les conditions d'hybridation specifiques ou de forte stringence seront telles 
qu'elles assurent au moins 80 %, de preference 90 % ou 95 % d'identite apres 
20 alignement entre Tune des deux sequences et la sequence complementaire de I'autre. 

Une hybridation dans des conditions de forte stringence signifie que les 
conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de I'hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de I'etape d'hybridation aux fins de 
25 definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCI + 0,015 M citrate 

30 de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardfs, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) 
hybridation proprement dite pendant 20 heures a une temperature dependant de ta 
taille de la s nde (i.e. : 42°C, pour un sonde de taille > 100 nucleotides) suivie de 2 
lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C 

35 en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS 
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pendant 30 minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions 
d' hybridation de forte stringence decrites ci-dessus pour un polynucleotide de taille 
definie, seront adaptees par I'homme du metier pour des oligonucleotides de taille plus 
grande ou plus petite, selon I'enseignement de Sambrook et al., 1989. 
5 Par resequence nucleique variante» ou «acide nucleique variant» d'une 

sequence nucleique de reference, on entendra designer I'ensemble des sequences 
nucleiques correspondant a des variants alleliques, e'est-a-dire des variations 
individuelles de la sequence nucleique de reference. Ces sequences mutees naturelles 
correspondent a des polymorphismes presents chez les mammiferes, en particulier 

10 chez I'etre humain et, notamment a des polymorphismes pouvant conduire a la 
survenue et/ou au developpement de pathologie. 

Si (es sequences seton ('invention concernent les sequences normales, elles 
concernent egalement les sequences mutees dans la mesure ou elles comportent au 
moins une mutation ponctuelle etde preference au plus 10 % de mutations par rapport 

15 a la sequence normale. 

En particulier, les sequences nucleiques variantes comprendront toute 
sequence d'au moins 15 nucleotides consecutifs, de preference 20, 25, 30, 50, 100 ou 
200 nucleotides consecutifs, d'une sequence polymorphique de la sequence 
genomique du gene SPG4 humain de sequence SEQ ID No. 1, et dont la sequence 

20 d'acide nucleique presente par rapport a la sequence SEQ ID No. 1 au moins une 
mutation correspondant notamment a une troncation, deletion, substitution et/ou 
addition de residu d'acide amine. Dans le cas present, les sequences nucleiques 
variantes presentant au moins une mutation seront ici liees aux pathologies de type 
PSF-AD liees au locus SPG4. 

25 De preference, la presente invention concerne des sequences nucleiques 

mutees dans lesquelles les mutations conduisent a une modification de la sequence 
d'acides amines du polypeptide code par la sequence normale. 

On entendra egalement designer par sequences nucleiques variantes tout ARN 
ou ADNc resultant d'une mutation d'un site d'epissage de la sequence nucleique 

30 genomique SEQ ID No. 1. 

De preference, I'invention concerne un acide nucleique purifie ou isole du gene • 
SPG4 selon I'invention, caracterise en ce qu'il comprend une sequence choisie parmi 
le groupe comprenant : 

a) la sequence SEQ ID No. 1, la sequence SEQ ID No. 2, la sequence SEQ ID No. 72, 
35 la sequence SEQ ID No. 106 ou la sequence d'au moins 15, de preference 20, 25, 
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30, 35, 40, 45, 50, 75, 100 ou 200 nucleotides consecutifs de la sequence SEQ ID 
No. 1, SEQ ID No, 2, SEQ ID No. 72 ou SEQ ID No. 106 ; 
b) les sequences nucleiques homologues ou variantes des sequences SEQ ID No. 1, 
SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 108 ; et 
5 c) la sequence complementaire ou la sequence de PARN correspondant aux 
sequences telles que definies en a) et b), 
. x-ference a I'exception de I'acide nucleique identifie dans la banque de donnees 
3ank sous le numero d'accession AB029006. 

L'acide nucleique dont la sequence est divulguee dans la banque de donnees 
GenBank sous le numero d'accession AB029006, correspond a la sequence de run 
des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiee par le 
Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6 f 197-205, 
1999). 

De preference, I'invention conceme un acide nucleique purifie ou isole selon 
15 I'invention, caracterise en ce qu'il comprend au moins une sequence d'au moins 15 
nucleotides consecutifs, de preference 20, 25, 30, 50 ou 75 nucleotides consecutifs du 
fragment nt 714-809, extremites incluses, de la sequence SEQ ID No. 2, de sa 
sequence complementaire ou de la sequence de son ARN correspondant. 

L'invention conceme de preference un acide nucleique purifie ou isole selon la 
20 presente invention, caracterise en ce qu'il comprend une sequence choisie parmi le 
groupe suivant : 

- la sequence SEQ ID No. 1 ; 

- la sequence SEQ ID No. 2, sequence de I'ADNc codant pour la spastin humaine ; 
-les sequences SEQ ID No. 72 et SEQ ID No. 106, la sequence SEQ ID No. 72 

25 representant la sequence de I'ADNc incomplet codant pour ia spastin murine 
representee a la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa sequence complete ; 

- les sequences nucleiques homologues ou variantes des sequences SEQ ID No. 1, 
SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; 

- leur sequence complementaire ; et 

30 - la sequence de leur ARN correspondant 

De preference, I'invention conceme un acide nucleique purifie ou isole selon 
I'invention, caracterise en ce qu'il comprend au moins une mutation correspondant a 
un polymorphisme naturel chez I'Homme, notamment dont la position et la nature sont 
identrfiees dans le tableau 5. 
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Les amorces ou sondes, caracterisees en ce qu'elles comprennent une 
sequence d'un acide nucleique selon I'invention, font egalement partie de ('invention. 

La presente invention conceme ainsi I'ensemble des amorces qui peuvent etre 
deduites des sequences nucleotidiques de I'invention et qui peuvent permettre de 
5 mettre en evidence lesdites sequences nucleotidiques de I'invention, en particulier les 
sequences mutees, en utilisant notamment une methode d'amplification telle que la 
mdthode PCR, ou une methode apparentee. 

La presente invention conceme egalement I'ensemble des sondes qui peuvent 
etre deduites des sequences nucleotidiques de (Invention , notamment des sequences 
10 capables de s'hybrider avec elles, et qui peuvent permettre de mettre en Evidence 
lesdites sequences nucleotidiques, en particulier de discri miner les sequences 
normales des sequences mutees. 

La presente invention conceme en particulier les sondes ou amorces de 
sequences choisies parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 
15 ^invention conceme egalement ('utilisation d'une sequence d'acide nucleique 

selon invention comme sonde ou amorce, pour la detection, identification, le dosage 
ou I'amplification de sequence d'acide nucleique. 

Selon ('invention, les polynucleotides pouvant etre utilises comme sonde ou 
comme amorce dans des precedes de detection, ^identification, de dosage ou 
20 d'amplification de sequence nucleique, presenteront une taille minimale de 15 bases, 
de preference de 20 bases, ou mieux de 25 a 30 bases. 

L'ensemble des sondes et amorces selon I'invention pourront etre marquees 
directement ou indirectement par un compose radioactif ou non radioactif par des 
mdthodes bien connues de I'homme du metier, afin d'obtenir un signal detectable et/ou 
25 quantifiable. 

Les sequences de polynucleotides selon I'invention non marquees peuvent etre 
utilisees directement comme sonde ou amorce. 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
30 selon ('invention est realise par des elements radioactifs ou par des molecules non 
radioactives. 

Parmi I s isotopes radioactifs utilises, on peut citer le K P, le ^P, le ^S, le 3 H ou 
le 125 L Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
I'avidine, la streptavidine, la dioxyg§nine, les haptenes, les colorants, les agents 
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luminescents tels que les agents radioluminescents, chemilurninescents, 
bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon I'invention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des proc&des mettant en oeuvre notamment la technique de PCR 
5 (reaction en chaine a la polym6rase) (Eriich, 1989 ; Innis et al., 1990, et Rolfs et al., 
1991). Cette technique necessite le choix de paires d'amorces oligonucleotidiques 
encadrant le fragment qui doit etre amplifie. On peut, par exemple, se referer a la 
technique decrite dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies 
peuvent etre identifies, par exemple apres une dlectrophorese en gel d f agarose ou de 

10 polyacrylamide, ou apres une technique chromatographique comme la filtration sur gel 
ou la chromatographie 6changeuse d'ions, puis sequences. La specificity de 
('amplification peut etre controtee en utilisant comme amorce ies sequences 
nucleotidiques de polynucleotides de I'invention comme matrice, des plasmides 
contenant ces sequences ou encore les produits d'amplification derives. Les fragments 

15 nucleotidiques amplifies peuvent etre utilises comme reactifs dans des reactions 
d'hybridation afin de mettre en Evidence la presence, dans un echantillon biologique, 
d'un acide nucleique cible de sequence complementaire a cede desdits fragments 
nucleotidiques amplffies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus 

20 par amplification k I'aide d'amorces selon ('invention. 

D'autres techniques d'amplification de I'acide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a Paide de 
couple d'amorces de sequences nucleotidiques selon I'invention. Par PCR-like on 
entendra designer toutes les methodes mettant en oeuvre des reproductions directes 

25 ou indirectes des sequences d'acides nucleiques, ou bien dans lesquelles les 
systemes de marquage ont ete amplifies, ces techniques sont bien entendu connues, 
en general il s'agit de Tamplificatton de I'ADN par une polymerase ; lorsque 
Techantillon d'origine est un ARN il convient prealablement d'effectuer une transcription 
reverse. II existe actuellement de tres nombreux precedes permettant cette 

30 amplification, comme par exemple la technique SDA (Strand Displacement 
Amplification) ou technique d'amplification a d6ptacement de brin (Walker et al., 1992), 
la technique TAS (Transcription-based Amplification System) decrite par Kwoh et al. en 
1989, la technique 3SR (Self-Sustained Sequence Replication) decrite par Guatelli et 
al. en 1990, la technique NASBA (Nucleic Acid Sequence Based Amplification) decrite 

35 par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la 
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technique LCR (Ligase Chain Reaction) decrite par Landegren et al. en 1988 et 
perfectionnee par Barany et al. en 1991, qui emploie une ligase thermostable, la 
technique de RCR (Repair Chain Reaction) decrite par Segev en 1992, la technique 
CPR (Cycling Probe Reaction) decrite par Duck et al. en 1990, la technique 
5 d'amplification a la Q-beta-replicase decrite par Miele et al. en 1983 et perfectionnee 
notamment par Chu et al. en 1986 et Lizardi et at. en 1988, puis par Burg et al. ainsi 
que par Stone et al. en 1996. 
- Dans le cas ou le polynucleotide cible a detecter est un ARNm, on utilisera 
ivantageusement, prealablement a la mise en oeuvre d'une reaction d'amplification a 

,o I'aide des amorces selon I'invention ou a ta mise en oeuvre d'un procede de detection 
a I'aide des sondes de I'invention, une enzyme de type transcriptase reverse afin 
a obtenir un ADNc a partir de I'ARNm contenu dans I'echantiilon biologique. L'ADNc 
obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le 
procede d'amplification ou de detection selon ('invention. 

15 La technique d'hybridation de sondes peut etre realisee de manieres diverses 

(Matthews et al., 1988). La methode la plus generate consiste a immobiliser Tacide 
nucleique extrait des cellules de differents tissus ou de cellules en culture sur un 
support (tels que la nitrocellulose, le nylon, le polystyrene) et a incuber, dans des 
conditions bien definies, Pacide nucleique cible immobilise avec la sonde. Apres 

20 I'hybridation, I'exces de sonde est elimine et les molecules hybrides formees sont 
detectees par la methode appropriee (mesure de (a radioactivite, de la fluorescence ou 
de I'activite enzymatique Itee a la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucleiques selon 
I'invention, ces demieres peuvent etre utilisees comme sonde de capture. Dans ce cas, 

25 une sonde, dite « sonde de capture », est immobilisee sur un support et sert a capturer 
par hybridation specifique I'acide nucleique cible obtenu a partir de I'echantiilon 
biologique a tester et I'acide nucleique cible est ensuite detecte grace a une seconde 
sonde, dite « sonde de detection », marquee par un element faciiement detectable. 

Les sequences selon (a presente invention de site accepteur ou donneur 

30 d'epissage identifiees au tableau 3 (sequences SEQ ID No. 74 a SEQ ID No. 105) font 
egalement partie de la presente invention. 

Sous un autre aspect, I'invention comprend une methode pour le criblage de 
banques d'ADNc ou d'ADN genomique, ou pour le clonage d'ADNc ou genomique 
isole codant pour la spastin, caracterisee en ce qu'elle met en oeuvre une sequence 

35 nucleique selon Tinvention. 
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Parmi ces methodes, on peut citer notamment : 
- le criblage de banques d'ADNc et le clonage des ADNc isoles (Sambrook et al., 
1989; Suggs et al. t 1981 ; Woo et al., 1979), a t'aide des sequences nucleiques 
selon I'invention ; 

5 - le criblage de banques genomiques, par exemple de BACs (Chumakov et al t 1992 ; 
Chumakov et al., 1995) et eventuellement une analyse g^netique en FISH (Cherif et 
a(., 1990) 3 Taide de sequences selon I'invention, permettant I'isolement et la 
localisation chromosomique, puis le sequencage complet du gene SPG4 codant pour 
la spastia 

10 En particulier, ces methodes selon i'invention pourront etre mises en oeuvre 

pour 1'identification et ainsi I'obtention de la sequence genomique ou de I'ADNc du 
gene SPG4 chez d'autres mammiferes, notamment la souris. 

Ces methodes de criblage et/ou de clonage comprendront en particulier une 
etape d'hybridation d'un acide nucleique selon I'invention avec un acide nucleique 

15 contenu dans une banque genomique ou d'ADNc. 

L'invention comprend aussi une methode d'identification des sequences d'acide 
nucleique promotrices et/ou regulatrices de I'expression du gene SPG4 de sequence 
SEQ ID No, 1, caracteris^e en ce qu'elie met en oeuvre un acide nucleique selon 
Tinvention. 

20 Les outils informatiques & la disposition de I'homme du metier lui permettent 

aisement d'identifier a partir des sequences nucleiques genomiques selon I'invention 
les boltes regulatrices promotrices necessaires et suffisantes au controle de 
Texpression genique, notamment les boltes TATA, CCAAT, GC, ainsi que les 
sequences regulatrices stimulatrices (« enhancer ») ou inhibitrices (« silencers ») qui 

25 controlent en CIS I'expression des genes selon I'invention ; parmi ces sequences 
regulatrices, il convient de citer TIRE, MRE, CRE. 

L'invention concerne egalement des methodes pour I'identification de mutations 
portees par le gene SPG4 humain caracterisees en ce qu'elles mettent en ceuvre une 
sequence nucleique selon Tinvention, notamment de mutations responsables de la 

30 paraptegie spastique familiale autosomique dominante. 

Ces methodes d'identification de ces mutations comprendront en particulier les 
etapes suivantes : (i) isolement de I'ADN a partir de I'echantillon biologique d analyser, 
ou obtention d'un ADNc a partir de I'ARNm de I'echantillon biologique ; (ii) amplification 
specifique de I'ADN cible susceptible de presenter une mutation a I'aide d'amorces 
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sel n 1'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la 
sequence des produits d'amplification, par rapport a une sequence de reference. 

Par methodes d'identification de mutation selon I'invention, on entend 
egalement designer une methode permettant d'obtenir I'acide nucleique sur lequel a 
5 ete identifiee ladite mutation. 

Font egalement partie de ('invention, les sequences promotrices et/ou 
regulatrices du gene SPG4 selon I'invention presentant des mutations susceptibles de 
modifier Texpression de la proteine correspondante. 

Les acides nucleiques caracterises en ce qu'ils sont susceptibles d'etre obtenus 
10 par une des methodes precedentes selon Tinvention, ou les acides nucleiques 
capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 
80 % entre une des deux sequences et la sequence complementaire de I'autr ) avec 
lesdits acides nucleiques, font partie de I'invention, notamment les acides nucleiques 
variants ou homologues, en particulier les sequences nucleiques de variants alleliques 
15 du gene SPG4 de sequence SEQ ID No. 1 ou de son ADNc de sequence SEQ ID 
No. 2, ainsi que les sequences genomiques des genes homologues d'autres 
mammiferes tels que ia souris. 

Dans la presente description, on entendra designer par "Spg^ 1 le gene de 
souris homologue au gene humain SPG4. 
20 (.'utilisation d'une sequence d'acide nucleique selon I'invention comme sonde 

ou amorce pour fe criblage de banque genomique ou d'ADNc fait bien entendu partie 
de I'objet de la presente invention. 

Sous un autre aspect, I'invention comprend un polypeptide purifte ou isole code 
par un acide nucleique selon I'invention, de preference a I'exception du peptide de 584 
25 acides amines dont la sequence est identifiee dans la banque de donnees GenBank 
sous le numero d'accession AB029006. 

Dans la presente description, on utilise ra le temne polypeptide pour designer 
egalement une proteine ou un peptide. 

De preference, la presente invention conceme un polypeptide selon Tinvention, 
30 caracterise en ce qu'il comprend une sequence d'acides amines choisie parmi le 
groupe suivant : 

- la sequence SEQ ID No. 3, correspondant a la spastin humaine codee par la 
sequence SEQ ID No. 2 de I'ADNc du gene SPG4 humain ; 
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- la sequence SEQ ID No. 73, correspondent a un fragment de la spastin murine codee 
par la sequence SEQ ID No. 72 de I'ADNc incomplet du gene Spg4 de souris, la 
sequence SEQ ID No. 73 est representee & la figure 4A, ligne "SPAST_MOUSE" ; 

-la sequence SEQ ID No. 107, correspondant a la spastin murine codee par la 
5 sequence SEQ ID No. 106 de I'ADNc complet du gene Spg4 de souris ; 

- les sequences de polypeptides homologues et variants du polypeptide de sequence 
SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et 

- les sequences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides amines 
consecutifs. 

10 De maniere egaiement preferee, I'invention a pour objet un polypeptide selon 

I'invention, caracterise en ce qu'il comprend une sequence d'acides amines choisie 
parmi le groupe comprenant : 

a) la sequence SEQ ID No. 3, la sequence SEQ ID No. 73, la sequence SEQ ID No. 
107 ou la sequence d'au moins 10 acides amines consecutifs d'une de ces 

1 5 sequences ; et 

b) les sequences homologues ou variantes des sequences SEQ ID No. 3, SEQ ID No. 
73 ou SEQ ID No; 107. 

De maniere egaiement preferee, I'invention a pour objet un polypeptide selon 
I'invention, caracterise en ce qu'il comprend la sequence d'au moins 8, de preference 
20 d'au moins 10, 15, 20 ou 30 acides amines consecutifs de la sequence du fragment aa 
197-228, extremites incluses, de la sequence SEQ ID No. 3. 

De maniere egaiement preferee, I'invention a pour objet un polypeptide selon 
I'invention, caracterise en ce qu'il comprend une sequence d'acides amines choisie 
parmi le groupe suivant : 
25 - la sequence SEQ ID No. 3, la sequence SEQ ID No. 73 et la sequence SEQ ID No. 
107, lesquelles sequences portant au moins une des mutations correspondant a un 
polymorphisme naturel chez rHomme, notamment celles dont la nature et la 
localisation sont identifies au tableau 5 ci-apres ou celies qui pourront etre 
identifies par les methodes d'identification de mutation du gene SPG4 selon la 
30 presente invention ; et 

- les sequences de leurs fragments d'au moins 8. 10, 15, 30 ou 50 acides amines 
consecutifs. 

II doit etre compris que I'invention ne conceme pas les polypeptides sous forme 
naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement. En effet, 
35 I'invention conceme les peptides obtenus par purification a partir de sources naturelles, 
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ou bien obtenus par recombinaison genetique, ou encore par synthese chimique et 
pouvant alors comporter des amino-acides non naturels. La production d'un 
polypeptide recombinant, qui peut etre r6alis6e en utilisant Tune des sequences 
nucleotidiques selon invention est particulferement avantageuse car elle permet 
5 d'obtenir un niveau de purete accrue du polypeptide desire. 

Par polypeptide homologue, on entendra designer les polypeptides presentant 
certaines modifications par rapport au polypeptide de reference, comme en particulier 
une ou plusieurs deletions, troncations, un allongement, une fusion chimerique, et/ou 
une ou plusieurs substitutions, et dont la sequence d'acides amines presente au moins 

10 80 %, de preference 90 % ou 95 %, d'identite apr^s alignement avec la sequence 
d'acides amines de reference. 

Par « polypeptide variant » (ou variant proteique), on entendra designer 
I'ensemble des polypeptides codes par les sequences nucleiques variantes telles que 
precedemment d6finies. 

15 En particulier, les polypeptides variants comprendront tout polypeptide code par 

la sequence g6nomique mutee du gene SPG4 de sequence SEQ ID No. 1, et dont la 
sequence d'acides amines presente au moins une mutation correspondant notamment 
a une troncation, delation, substitution et/ou addition de residus d'acides amines par 
rapport a la sequence SEQ ID No. 3. Dans le cas present, les polypeptides variants 

20 presentant au moins une mutation seront lies aux pathologies de type PSF-AD. 

On entendra egalement designer par polypeptide variant tout polypeptide 
resultant de mutation d'un site d'epissage dans la sequence nucleique genomique 
SEQ ID No. 1. 

L'invention comprend egalement les vecteurs de clonage et/ou d'expression 
25 contenant une sequence d'acide nucleique selon Tinvention. 

Les vecteurs selon l'invention, caracteris§s en ce qu'iis comportent les 
Elements permettant I'expression et/ou la s6cr6tion desdites sequences dans une 
cellule hote, ou encore une sequence d'adressage cellulaire, font egalement partie de 
l'invention. 

30 Les vecteurs caracterises en ce qu'iis comportent une sequence de promoteur 

et/ou de r6gulateur selon l'invention, font Egalement partie de l'invention. 

Lesdits v cteurs comporteront de preference un promoteur, des signaux 
d'initiation et de terminaison de la traduction, ainsi que des regions appropriees de 
regulation de la transcription, lis doivent pouvoir 6tre maintenus de fa9on stable dans la 
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cellule et peuvent eventuellement posseder des signaux particuliers specifiant la 
secretion de la proteine traduite. 

Ces differents signaux de controle sont choisis en fonction de I'hote cellulaire 
utilise. A cet effet, les sequences d'acide nucleique selon I'invention peuvent etre 
5 inserees dans des vecteurs a replication autonome au sein de I'hote choisi, ou des 
vecteurs integratifs de I'hdte choisi. 

Parmi les systemes a replication autonome, on utilisera de preference en 
fonction de la cellule note, des systemes de type plasmidique ou viral, les vecteurs 
viraux pouvant notamment etre des adenovirus (Penicaudet et al., 1992), des 
10 retrovirus, des lentivirus, des poxvirus ou des virus herpetiques (Epstein et al., 1992). 
L'homme du metier connait les technologies utilisables pour chacun de ces systemes. 

Lorsque Ton souhaitera I' integration de la sequence dans les chromosomes de 
la cellule note, on pourra utiliser par exemple des systemes de type plasmidique ou 
viral ; de tels virus seront, par exemple, les retrovirus (Temin, 1986), ou les AAV 
15 (Carter, 1993). 

Parmi les vecteurs non viraux, on prefere les polynucleotides nus tels que I'ADN 
nu ou TARN nu selon la technique developpee par la societe VICAL, les chromosomes 
artificiels de levure (YAC, yeast artificial chromosome) pour I'expression dans la levure, 
les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour 
20 I'expression dans les cellules murines et de maniere preferee les chromosomes 
artificiels d'homme (HAC, human artificial chromosome) pour I'expression dans les 
cellules humaines. 

De tels vecteurs seront prepares selon les methodes couramment utilisees par 
rhomme du metier, et les clones en resultant peuvent etre introduits dans un note 
25 approprie par des methodes standard, telles que par exemple la lipofection, 
I'electroporation, le choc thermique. 

(.'invention comprend en outre les cellules notes, notamment les cellules 
eucaryotes et procaryotes, transformees par les vecteurs selon I'invention ainsi que les 
animaux transgeniques, excepte I'Homme, comprenant une desdites cellules 
30 transformees selon I'invention. 

Parmi les cellules utilisables a ces fins, on peut citer bien entendu les cellules 
bacteriennes (Olins et Lee, 1993), mais egalement les cellules de levure (Buckholz, 
1993), de meme que les cellules animates, en particulier les cultures de cellules de 
mammiferes (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster 
35 chinois (CHO), mais ' galement les cellules d'insectes dans lesquelles on peut utiliser 
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des precedes mettant en oeuvre des baculovirus par exemple (Luckow, 1993). Un hdte 
cellulaire prefere pour I'expression des proteines de ('invention est constitue par les 
cellules CHO. 

Parmi les mammiferes selon Convention, on preferera des animaux tels que les 
5 souris, les rats ou les lapins, exprimant un polypeptide selon Tinvention. 

Parmi les mammiferes selon i'invention, on preferera egalement ceux 
comprenant une cellule transformee caracterisee en ce que la sequence de Tun au 
moins des deux alleles du gene SPG4 contient une au moins des mutations 
correspondant a un polymorphisme nature) chez I'Homme, notamment celles dont la 
1 0 nature et la localisation sont identifies au tableau 5 ci-apres ou celles qui pourront etre 
identifiees par les methodes d'identification de mutation du gene SPG4 selon la 
presente invention. 

Parmi les mammiferes selon I'invention, on preferera egalement des animaux 
tels que les souris, les rats ou les lapins, caracterises en ce que le gene codant pour la 
15 spastin selon invention, n'est pas fonctionnel ou est invalided 

Parmi les modeles animaux plus particulierement interessants id, on trouve 
notamment : 

- les animaux transgeniques presentant au moins dans une de leurs deux sequences 
alleliques du gene SPG4, une au moins des mutations dont la position et la nature 

20 sont identifiees au tableau 5 ou identifiees par une methode selon la presente 
invention. Ces animaux transgeniques sont obtenus par exemple par recombinaison 
homologue sur cellules souches embryonnaires, transfert de ces cellules souches a 
des embryons, selection des chimeres affectees au niveau des lignees 
reproductrices, et croissance desdites chimeres ; 

25 - les animaux (de preference souris) transgeniques surexprimant le gene SPG4 dans 
lequel pourra etre introduite une desdites mutations selon rinvention. Les souris sont 
obtenues par exemple par transfection de copie de ce gene sous contrdle d'un 
promoteur fort de nature ubiquitaire, ou selectif d'un type de tissu, ou apres 
transcription virale ; 

30 - les animaux (de preference souris) transgeniques rendus deficients pour le gene 
SPG4 selon I'invention, par inactivation a i'aide du systeme LOXP/CRE recombinase 
(Rohlmann et al., 1996) ou de tout autre systeme deactivation de T xpression de ce 
gene. 

Les cellules et mammiferes selon ('invention sont utilisables dans une methode 
35 de production d;un polypeptide selon I'invention, comme decrit ci-dessous, et peuvent 
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egalement servir a titre de modele d'analyse et pour le criblage de banque d'ADN 

(genomique ou d'ADNc). 

Les cellules ou mammiferes transformes tels que decrits precedemment 

peuvent etre ainsi utilisees £ titre de modeles afin d'etudier les interactions entre les 
5 polypeptides selon ('invention, et les composes chimiques ou proteiques, impliques 

directement ou indirectement dans les activites des polypeptides selon I'invention, ceci 

afin d'etudier les differents mecanismes et interactions mis en jeu. 

Surtout, its peuvent etre utilises pour fa selection de produits interagissant avec 

les polypeptides selon ('invention, notamment la spastin humaine de sequence SEQ ID 
10 No. 3 ou ses variants selon I'invention, a titre de cofacteur, ou d'inhibiteur, notamment 

competitif, ou encore ayant une activite agoniste ou antagonists de ('activite des 

polypeptides selon I'invention. De preference, on utilisera lesdites cellules 

transformees ou animaux transgeniques a titre de modele permettant, notamment, la 

selection de produits permettant de lutter contre la pathologie liee au gene SPG4 
15 mentionnee ci-dessus. 

L'invention conceme egalement ('utilisation de cellule, de mammifere ou de 

polypeptide selon I'invention pour te criblage de compose chimique ou btochimique 

pouvant interagir directement ou indirectement avec les polypeptides selon I'invention, 

et/ou capable de moduler ('expression ou I'activite de ces polypeptides. 
20 L'invention conceme egalement I'utilisation d'une sequence d'acide nucleique 

selon ('invention pour la synthese de polypeptides recombinants. 

La methode de production d'un polypeptide de I'invention sous forme 

recombinante est elle-meme comprise dans la presente invention, et se caracterise en 

ce que Ton cultive les celfutes transformees, notamment (es cellules ou mammiferes de 
25 la presente invention, dans des conditions permettant ('expression d'un polypeptide 

recombinant code par une sequence d'acide nucleique selon I'invention, et que Ton 

recupere (edit polypeptide recombinant 

Les polypeptides recombinants, caracterises en ce qu'ils sont susceptibles 

d'etre obtenus par ladite methode de production, font egalement partie de I'invention. 
30 Les polypeptides recombinants obtenus comme indique ci-dessus, peuvent 

aussi bien se presenter sous forme glycosylee que non glycosylee et peuvent 

presenter ou non la structure tertiaire naturelle. 

Ces polypeptides peuvent etre produits a partir des sequences d'acide 

nucleique definies ci-dessus, seion les techniques de production de polypeptides 
35 recombinants connues de I'homme du metier. Dans ce cas, la sequence d'acide 
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nucleique utilisee est placee sous le controle de signaux permettant son expression 

dans un hote cellulaire. 

Un sysfeme efficace de production d'un polypeptide recombinant necessite de 

disposer d'un vecteur et d'une cellule hote selon I'invention. 
5 Ces cellules peuvent etre obtenues par ('introduction dans des cellules hotes 

d'une sequence nucleotidique inseree dans un vecteur tel que defini ci-dessus, puis la 

mise en culture desdites cellules dans des conditions permettant la replication et/ou 

1'expression de la sequence nucleotidique transferee. 

Les precedes de purification de polypeptide recombinant utilises sont connus 
10 de I'homme du metier. Le polypeptide recombinant peut etre purifie a partir de lysats et 

extraits celtulaires, du surnageant du milieu de culture, par des methodes utilisees 

individuellement ou en combinaison, telles que le fraction nement, les methodes de 

chromatographic, les techniques d'immunoaffinite a I'aide d'anticorps monoclonaux ou 

polyclonaux specifiques, etc.. 
15 Les polypeptides selon la presente invention peuvent etre obtenus par synthase 

chimique et ce en utilisant Tune des nombreuses syntheses peptidiques connues, par 

exemple les techniques mettant en oeuvre des phases solides ou des techniques 

utilisant des phases solides partielles, par condensation de fragments ou par une 

synthase en solution classique. 
20 La technique de synthese en phase sofide est bien connue de I'homme du 

metier. Voir notamment Stewart et af. (1984) et Bodansky (1984). 

Les polypeptides obtenus par synthese chimique et pouvant comporter des 

acides amines non naturels correspondents sont egalement compris dans I'invention. 
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimeriques 
25 ou immunoconjugues, caracte rises en ce qu'ils sont capables de reconnaitre 

specifiquement un polypeptide selon Tinvention, font partie de (Invention. 

Des anticorps polyclonaux sp^crfiques peuvent etre obtenus a partir d'un serum 

d'un animal immunise contre les polypeptides seton ('invention, notamment produit par 

recombinaison genetique ou par synthese peptidique, selon les modes operatoires 
30 usuets. 

On notera notamment l'inter§t d'anticorps reconnaissant de fa$on sp^citlque 
certains polypeptides, variants, ou leurs fragments immunogenes, selon ('invention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridomes decrite par Kohleret Milstein, 1975. 
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Les anticorps selon ('invention sont, par exemple, des anticorps chimeriques, 
des anticorps humanises, des fragments Fab ou F(ab') 2 lis peuvent 6galement se 
presenter sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un 
signal detectable et/ou quantifiable. 
5 L'invention conceme egalement des methodes pour la detection et/ou la 

purification d'un polypeptide selon l'invention, caracteris6es en ce qu'elles mettent en 
oeuvre un anticorps selon l'invention. 

..'invention comprend en outre des polypeptides purifies, caracteris6s en ce 
. s sont obtenus par une methode selon l'invention. 

°ar ailleurs, outre leur utilisation pour la purification des polypeptides, les 
j;ps de l'invention, en particulier les anticorps monoclonaux, peuvent egalement 
etre utilises pour la detection de ces polypeptides dans un echantillon biologique. 

lis constituent ainsi un moyen d'analyse immunocytochimique ou immuno- 
histochimique de I'expression des polypeptides selon l'invention, notamment le 
15 polypeptide de sequence SEQ ID No. 3 ou Tun de ses variants, sur des coupes de 
tissus specifiques, par exemple par immunofluorescence, marquage a Tor, immuno- 
conjugu6s enzymatiques. 

Ils pourront permettre notamment de mettre en evidence une expression 
anormale de ces polypeptides dans les tissus ou prelevements biologiques, ce qui les 
20 rend utiles pour le suivi de revolution de la maladie et le diagnostic moleculaire. 

Plus generalement, les anticorps de l'invention peuvent etre avantageusement 
mis en oeuvre dans toute situation ou ('expression d'un polypeptide selon I'inventi n, 
normal ou mute, doit §tre observee. 

Font Egalement partie de l'invention, les methodes de determination d'une 
25 variability all6Iique, d'une mutation, d'une deletion, d'une perte d'heterozygotie ou de 
toute anomalie genetique du gene SPG4 selon l'invention, caract§risees en ce qu'elles 
mettent en oeuvre une sequence d'acide nucleique ou un anticorps selon l'invention. 

La presente invention comprend ainsi une methode de diagnostic genotypique 
de la pathologie associ£e au g6ne SPG4, caracteris^e en ce que Ton met en oeuvre 
30 une sequence d'acide nucleique selon l'invention. 

De preference, ('invention conceme une methode de diagnostic genotypique de 
la maladie associee a la presence d'au moins une mutation sur une sequence du gdne 
SPG4 a partir d'un prelevement biologique d'un patient, caracterise en ce qu'il 
comporte les etapes suivantes : 
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a) le cas echeant, isotement de PADN genomique a partir de I'echantillon biologique a 
analyser, ou obtention d'ADNc a partir de TARN de I'echantillon biologique ; 

b) amplification specifique de ladite sequence d'ADN du gene SPG4 susceptible de 
contenir une mutation a I'aide d'amorces selon invention ; 

5 c) analyse des produits d'amplification obtenus et comparaison de leur sequence avec 
la sequence normale correspondante du gene SPG4. 

L'invention comprend egalement une methode de diagnostic de la maladie 
associee a une expression anormale d'un polypeptide code par le gene SPG4, 
notamment le polypeptide de sequence SEQ ID No. 3, caracterisee en ce que Ton met 

10 en contact un ou des anticorps selon rinvention avec le materiel biologique a tester, 
dans des conditions permettant la formation eventuelle de complexes immunologiques 
specifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que Ton detecte 
et/ou quantifie les complexes immunologiques eventuellement formes. 

Ces methodes visent par exemple les methodes de diagnostic de la PSF-AD 

15 associee a la presence de mutation dans le gene SPG4 selon l'invention, notamment 
antenatal, en determinant a partir d'un prelevement biologique du patient la presence 
de mutations dans au moins une des sequences decrites precedemment. Les 
sequences d'acides nucleiques analysees pourront aussi bien etre de I'ADN 
genomique, de I'ADNc, ou de I'ARNm. 

20 Des acides nucleiques ou anticorps bases sur la presente invention pourront 

egalement etre utilises pour permettre un diagnostic positif chez un malade ou un 
diagnostic pre-symptomatique chez un sujet a risque, notamment avec antecedent 
familial. 

Les methodes permettant de mettre en evidence une mutation dans un gene 
25 par rapport au gene sauvage sont, bien entendu, tres nombreuses. On peut 
essentiellement ies diviser en deux grandes categories. Le premier type de methode 
est celui dans lequel la presence d'une mutation est detectee par comparaison de la 
sequence mutee avec la sequence correspondante sauvage, et le second type est 
celui dans lequel la presence de la mutation est detectee de faoon indirecte, par 
30 exemple par evidence de mesappariements dus a la presence de la mutation, 

Ces methodes peuvent mettre en oeuvre les sondes et amorces de la presente 
invention decrites. II s'agit generalement de sequences nucleiques d'hybridation 
purifiees comprenant au moins 15 nucleotides, de pref 'rence 20, 25 ou 30 nucleotides, 
caracterisees en ce qu'elles peuvent s'hybrider specifiquement avec une sequence 
35 nucleique selon rinvention. 
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De preference, les conditions d'hybridation specifiques sont telles que celles 
deiinies precedemment ou dans les exemples. La longueur de ces sequences 
nucleiques d'hybridation peut varier de 15, 20 ou 30 d 200 nucleotides, 
particulierement de 20 a 50 nucleotides. 
5 Parmi les methodes de determination d'une variability altelique, d'une mutation, 

d'une deletion, d'une perte d'heterozygotie ou d'une anomalie genetique, on prefere les 
methodes comprenant au moins une etape d'amplification dite par PCR (reaction en 
chame par la polymerase) ou par PCR-like de la sequence cible selon I'invention 
susceptible de presenter une anomalie a I'aide de couple d'amorces de sequences 
10 nucleotidiques selon I'invention. Les produits amplifies pourront etre traites a I'aide 
d'enzyme de restriction appropriee avant de proc£der a la detection ou au dosage du 
produit cible. 

Les mutations du gene SPG4 selon Pinvention, peuvent etre responsables de 
d iff e rentes modifications de son produit de traduction, modifications utilisables pour 

15 une approche diagnostique. En effet, les modifications d'antigenicite liees a ces 
mutations peuvent permettre la mise au point d'anticorps specifiques. La discrimination 
du produit de gene mute peut etre realisee par ces methodes. Toutes ces modifications 
peuvent etre utilisees dans une approche diagnostique grace a plusieurs methodes 
bien connues basees sur Futilisation d'anticorps mono- ou polyclonaux reconnaissant 

20 le polypeptide normal ou des variants mutes, comme par exemple par RIA ou par 
ELISA. 

Ainsi, I'invention a dgalement pour objet une trousse ou necessaire pour le 
diagnostic, notamment pour le diagnostic de la PSF-AD associee a la presence de 
mutation dans le gene SPG4 selon invention, caracteris6e en ce qu'elle comprend au 
25 moins un compost choisi parmi le groupe de composes suivant : 

a) un acide nuc!6ique, notamment comme amorce ou sonde, selon la presente 
invention ; et 

b) un anticorps selon ('invention. 

Sous un autre aspect, invention comprend une methode de selection d'un 
30 compose chimique ou biochimique capable de prevenir et/ou de traiter la PSF-AD 
associ6e au gene SPG4, caracterisee en ce que I'on met en ceuvre une sequence 
d'acide nucleique selon I'invention, un polypeptide selon ('invention, un vecteur selon 
I'invention, une cellule selon ('invention, un mammifere selon I'inv ntion ou un anticorps 
selon I'invention. 
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Sont egalement comprises dans invention, les methodes de selection de 
composes chimiques ou biochimiques capables d'interagir directement ou 
indirectement avec des polypeptides selon rinvention ou avec les acides nucleiques 
selon ('invention, et/ou permettant de moduler ('expression ou Tactivite de ces 
5 polypeptides, caracterisees en ce qu'elles comprennent la mise en contact d'un 
polypeptide selon 1'invention, d'une cellule transformee selon Tinvention, ou d'un 
mammifere selon invention, avec un compose cahdidat et, la detection d'une 
modification de Tactivite dudit polypeptide. 

Par exemple, mais sans s'y limiter, on peut citer une methode d'identification de 
olecules capables d'interagir avec un polypeptide selon Pinverition en utilisant un 
\'VSteme de double hybride bacterien ou levure tel que le Matchmaker Two Hybrid 
System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid 
System 2 (Catalogue N° K1604-1, Clontech). 

Les acides nucleiques codant pour des proteines interagissant avec les 
1 5 sequences promotrices et/ou regulatrices du g6ne SPG4 selon rinvention, peuvent etre 
cribles et/ou selectionnes en utilisant un systeme de simple hybride tel que celui decrit 
dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech 
(Catalog N c K1603-). 

Sous un autre aspect, Tinvention comprend I'utilisation d'acide nucl6ique ou de 
20 polypeptide selon rinvention, d'un vecteur selon Tinvention, d'une cellule selon 
Tinvention, ou d'un mammifere selon Tinvention, pour ('etude de ('expression ou de 
I'activite du g£ne SPG4. 

D'autres caract^ristiques et avantages de Tinvention apparaissent dans la suite 
25 de la description avec les exemples et les figures dont les legendes sont representees 
ci-apr&s. 

LEGENDES DES FIGURES 

FIGURES 1A, 1B et 1C : Carte physique de I'intervalle SPG4 et organisation 

30 genomique de SPG4. 

FIGURE 1A : La region candidate de 1,5 Mb est delimitee par les marqueurs 
genetiques D2S352 et D2S2347 indiques en caracteres gras. La position des 
marqueurs polymorphes et autres STSs est.indiqu^e en caracteres standards alors 
que la position des ESTs est indiquee en italique. Les clones de BAC constituant la 

35 carte de presequencage sont representes par des rectangles dont le nom figure au- 
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dessus et la taille precise du clone au-dessous si celle-ci a pu etre determinee. Le nom 
des BACs A, B, C. ... est suivi d'une parenthese contenant le nom du clone precede 
d'un « b » si le clone est issu de la banque de BACs C1TB_978_SKB ou d'un « B » si 
celui-ci provient de la banque RPCI-11. 
5 FIGURE 1B : Representation schematique du gene SPG4 qui chevauche les 

BACs D (b336P14) et G (B563N4). Les exons sont figures comme des rectangles noirs 
avec leur nom au-dessus. 

FIGURE 1C : Les cinq mutations identifies dans sept families de PSF-AD liees 
au locus SPG4 sont positionnees dans les exons 7, 11, 13 et dans le site accepteur 

10 d'epissage de Pintron 15. 

FIGURE 2 : Sequence nucleique et proteique de I'ADNc SPG4 et de la spastin. 

Les 17 barres verticales avec un nombre situe au-dessous represented les 
jonctions entre les differents exons. Le codon ATG initiateur est localise en position nt 
126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des 

15 mutations identifies a ce jour, dont la perte de I'exon 16, sont indiquees en italique (nt 
1210, nt 1468, nt 1520, nt 1620 et pour la perte de I'exon 16 : nt 1813-1853). Le site de 
polyadenylation est en italique et souligne. Le signal de localisation nucleaire (NLS) 
putatif, RGKKK, ainsi que les trois domaines conserves predits par I'analyse dans la 
base de donnees ProDom sont respectivement localises aux positions aa7-11 (NILS), 

20 aa342-409 (domaine 92), aa41 1-509 (domaine 179) et aa51 2-599 (domaine 6226). Les 
quatre motifs predits par la comparaison de sequence dans la base de donnees 
Prosite sont : deux motifs ^leucine zippers» aux positions aa5f>78 et aa508-529, le 
site de fixation de I'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine 
de dimerisation « helix-loop-helix » aux positions aa478-486. Les motifs A et B de 

25 Walker, «GPPGNGKT» et «HFIDE» J ainsi que le consensus minimal des AAA sont 
soulignes. 

FIGURES 3A et 3B .: CaracXerisation d'une mutation d'un site d'epissage chez les 
individus atteints de trois families de PSF-AD liee au locus SPG4. 

FIGURE 3A : Amplification par PCR du fragment IV de I'ADNc SPG4 a partir 
30 d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, 
membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ; puits 3, 
membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ; puits 5, 
patient de la famille 5226 ; puits 6, temoin negatif (ADN genomique humain). 

FIGURE 3B : Graphe de sequence de fa mutation du site accepteur d'epissage 
35 de Tintron 15. 
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Sequence genomique de I'individu contrdle en haut et d'un patient de la famille 
2992 en bas. L'asterisque a la position nt 1813-4 indique un polymorphisme A->C qui 
touche un nucleotide non conserve du site accepteur d'epissage de I'intron 15 chez le 
patient. 

5 FIGURES 4A et 4B : Les homologies de la spastin. 

Les residus identiques sont respectivement surlignes en grise. 
FIGURE 4A : Alignement multiple cree par CLUSTAL W de huit proteines 
issues de divers organismes et presentant une forte homologie de sequence avec les 
spastin humaine et murine (SEQ ID No. 73). 
10 FIGURE 4B : Alignement par CLUSTAL W des metalloproteases de levure 

AFG3, RCA1 et YME1, et des paraplegin et spastin humaines. 

FIGURE 5 : Alignement par BLASTN des sequences nucleiques de I'ADNc SPG4 et de 
son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadenylation de I'ADNc 
murin est souligne et en italique. Le codon STOP est localise en position nt 1515-1517 
15 dans I'ADNc murin et en position nt 1974-1976 dans I'ADNc humain. 

FIGURES 6A, 6B et 6C : Analyse par PCR de I'expression de SPG4 et de son 
orthologue murin Spg4. 

FIGURE 6A : Collection d'ADNc provenant de multiples tissus de souris. 
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ; 
20 puits 3, rate ; puits 4, poumon ; puits 5 f foie ; puits 6, muscle squelettique ; puits 7, 
rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7 ; puits 10, embryon de 11 jours 
E11 ; puits 11, embryon de 15 jours E15 ; puits 12, embryon de 17 jours E17 ; puits 13, 
temoin negatif (ADN genomique de souris). 

FIGURE 6B : Collection d'ADNc provenant de multiples tissus humains. 
25 Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ; 

puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancreas ; puits 7, placenta ; puits 
8, muscle squelettique ; puits 9, temoin negatif (ADN genomique humain) ; puits 10, 
temoin negatif (pas d'ADN). 

FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus 

30 humain. 

Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ; 
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, 
rate ; puits 8. thymus ; puits 9, temoin negatif (ADN genomique humain) ; puits 10, 
temoin negatif (pas d'ADN). 
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EXEMPLES 

Exemple 1 : Materiels et methodes 

1) Sous-clonage et sequencage de la region candidate 

Douze BACs provenant de deux banques genomiques humaines, 
5 CITB_978_SKB (commercialisees par Research Genetics) et RPCM 1 (Osoegawa et 
at., 1998), et recouvrant I'intervalle SPG4 ont ete selectionnes pour etre sequences 
(Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de I'ADN de chaque BAC a 6te 
digere partiellement par Tenzyme de restriction CviJI (CHIMERx) et separe par 
electrophorese sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les 

10 tallies varient autour de 3, 5 et 10 kb ont ete eluees avec la p-agarase (Biolabs) et 
liguees a un vecteur plasmide pBAM3 prealablement digere par Smal et 
dephosphoryle dans un rapport de IXinsert pour SXvecteur. Des bacteries E. coli 
DH10B 6lectrocompetentes (GIBCO-BRL) ont et6 transformees par electroporation 
avec les differentes ligations. Environ 1000 a 1500 sous-clones par BAC (8 a 10 

15 genomes equivalents) composes de 20 % de clones avec inserts a 10 kb, 40 % de 
clones avec inserts a 5 kb et 40 % de clones avec inserts a 3 kb ont ete isoles. Les 
extremites des inserts de ces clones ont 6te sequencees sur un sequenceur 
automatique LICOR 4200. Pour chaque BAC, les sequences furent assemblies en un 
squelette constitue de plusieurs contigs a I'aide des logiciels Phred et Phrap. Les trous 

20 entre chaque contig furent sequences avec des dideoxynucleotides marques sur un 
sequenceur ABI 377 (PE-Applied Biosystems), Les exons contenus dans ces contigs 
de sequence ont et6 predits par les programmes informatiques GRAIL II, GENSCAN, 
FGENEH et Genie. Les sequences furent egalement comparees dans les bases de 
donnees nucleiques et proteiques de I'EMBL et de GenBank avec les programmes 

25 BLASTN et BLASTX. La determination des sequences promotrices fut realisee par les 
programmes informatiques TSSG et TSSW. Les resultats de toutes ces analyses d 
sequences furent visualises par te programme d'annotation de sequence Genotator. 

2) Clonage de I'ADNc 

L'ADNc du gene SPG4 a ete isole par des experiences de RACE-PCR en 5' et 
30 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte a I'aide du kit 
d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une 
premiere PCR, suivie d'une PCR interne furent effectuees avec differents couples 
d'amorces dont les sequences sont indiquees sur le tableau 1 ci-apres : 
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Tabl au 1 

Amorces utilisees pour les RACE-PCR et les amplifications d'ADNc 



Amorce 



Sequence (S'-S') 



Position en 5' couple/ PCR Taille du produit 



SPA_ 


5RACE5 


SPA. 


5RACE6 


SPA. 


5RACE7 


SPA. 


3 RACE 1 


SPA. 


3RACE2 


SPA_ 


.3RACE3 


SPA. 


_3RACE4 


SPA. 


.3RACE5 


SPA. 


.3RACE6 


SPA. 


.3RACE7 


SPA 


3RACE8 



CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405 

AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372 
AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331 
AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550 
TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689 
CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747 
TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075 
CTTCTCTGAGGCCTGAGTTGTTCAC (SEQIDNo.11) nt 1207 
TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.1 2) nt 1 736 
AGATGCAGCACTGGGTCCTATCCG (SEQ ID No.13) nt 1787 

ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No. 1 4) nt 2037 



SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) 


nt45 


b+m 


655 pb 


SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) 


nt 700 






SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No. 17) 


nt106 


c+n 


543 pb 


SPA_Dn CTAGCTCTTTCACACTGTTC (SEQ ID No. 18) 


nt 649 






SPA_Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) 


nt487 


d+n 


746 pb 


SPA__Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) 


nt1233 






SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No.21) 


nt 532 






SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) 


nt1175 






SPA_Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) 


nt1036 


a+m 


763 pb 


SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) 


nt1799 






SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) 


nt 1076 






SPA__Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) 


nt1780 






SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) 


nt1550 


a+m 


766 pb 


SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) 


nt 2316 






SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) 


nt 1603 
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Les produits de RACE-PCR ont ete clon s avec le kit TA-cloning (Invitrogen) et 
les clones correspondants ont ete sequences sur un ABI 377 (PE-Applied Biosy stems). 
La sequence du transcrit SPG4 a ete verifiee par le sequencage de produits de PCR 
amplifies a partir d'une population d'ADNc provenant des lymphoblastes de 6 individus 
5 sains. 

3) Detection des mutations 

Les ARNs totaux ont ete extraits de lignees de lymphoblastes d'un individu 
atteint par famille etudiee et de 6 individus temoins a I'aide du kit RNA PLUSR 
(bioprobe System). La synthese de I'ADNc a ete realisee sur 500 ng a 1 ug d'ARN 

10 avec 100 pmoles d'amorces hexameres aleatoires (Pharmacia) et 200 unites de 
reverse transcriptase Superscript II (Gibco BRL) dans des conditions standards. 
Quatre amplifications par PCR, generant des fragments chevauchants qui recouvrent 
la totalite de la phase ouverte de lecture de SPG4, ont ete realisees sur les ADNc des 
patients et contrdtes. Le fragment I fut amplifie avec les amorces SPA_Db/SPA_Dm, 

15 puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont 
ete respectivement amplifies avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm 
et SPA_Ca/SPA_Cm (cf. les sequences de ces amorces sur le tableau 1). Chaque 
amplification a ete effectuee dans un volume total de 50 ul contenant 4 ul d'ADNc 
(-1/7 erne de la prep.), 20 pmoles de chaque amorce, 200 uM de dNTPs, 50 mM de 

20 KCI, 10 mM de Tris pH9, 1,5 mM MgCI2 t 0,1 % de triton X-100, 0,01 % de gelatine et 
2,5 unites de Taq polymerase (Cetus-PE). Les reactions de PCR ont ete realisees 
selon le procede du « hot start » : la Taq polymerase est ajoutee a 92°C apres une 
premiere etape de denaturation de 5 min a 94°C. Les echantillons sont par la suite 
soumis a 35 cycles de denaturation (94°C pendant 40 sec), d'hybridation (55°C 

25 pendant 50 sec, a Texception du fragment I : 58°C pendant 50 sec) et d'elongation 
(72°C pendant 1 min), suivis d'une demiere etape d'elongation (5 min a 72°C). Les 
produits de PCR sont sequences sur un sequenceur automatique ABI 377 (PE-Applied 
Biosystems) avec les amorces SPA_Dc/SPA_Dn, SPA_Ac/SPA_An, SPA_Bb/SPA_Bn 
et SPA_Cb/SPA_Cm pour les fragments I, II, 111 et IV respectivement 

30 Les mutations furent egalement recherchees ou confirmees par sequencage 

des 17 exons predits du gene SPG4 chez les patients et controles. Chaque exon fut 
amplifie avec le couple correspondant d'amorces « a+m » (cf. tableau 2 ci-apres), & 
Texception de I'exon 1 (gSPAex1c/gSPAex1m), etdes exons 10, 11 et 12 qui furent co- 
amplifies avec les couples d'amorces gSPAex10a/gSPAex12m et 

35 gSPAex11a/gSPAex12m. 
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Tableau 2 

Amorces de PCR pour ('amplification et I sequencage des xons 



Exon 


Taille du produit Programme de PCR Amorce 


Sequence (V-Z*) (SEQ id Nos. ; 30 a 71) 


1 


1048 pb 


0 


gSPAexIc 
gSPAexIm 
gSPAexld 
gSPAexIn 


GTGAGCCGAACTGCACATTG 
CAAAGTCGACAGCTACAGTGC 
GGAACTGTAGTTGAGTGGGA 
AGATGAGGCTCCGACCTAC 


2 


624 pb 


3 


gSPAex2a 
gSPAex2m 
gSPAex2b 


AATGCCACACTTGTAATCTC 

TGTGAATATATCATAATTTGGG 

TACAGCAGTTCTCATGATG 


3 


812 pb 


1 


gSPAex3a 
gSPAex3m 


GACCAAATTGGTGCATGCATG 
ACATTTCCAATACATCCCAC 


4 


379 pb 


3 


gSPAex4a 

gSPAex4m 

gSPAex4n 


ATTTGTCATTTCACATGCAC 
TTAGAATGACTATACCTGAC 
TCAGGTTAAGTAAGACTC 


5 


830 pb 


4 


gSPAex5a 
gSPAex5m 
gSPAex5b 


TTCCTATCTACCTAGTGAC 
I I I I ATAGCAAGTTGCCCTG 
CCTATGAAGATCCTGGTAC 


6 


484 pb 

• 


3 


gSPAex6a 
gSPAex6m 


TGTCATGATTCTAACAAGGG 
TCTATTTCACTCCTGACATG 


7 


420 pb 


2 


gSPAex7a 
gSPAex7m 


GTCATAGGGCTTAGGCTTC 
ATCATACTACCCAC I II ICC 


8 


647 pb 


3 


gSPAex8a 
gSPAex8m 


TGTTTGGGAAGATGCTACTG 
CTACTGAAGATAACGTACATG 


9 


1268 pb 


1 


gSPAex9a 
gSPAex9m 
gSPAex9b 


CATTGATTGCCATGTATTGG 

AGAAGGCCAGAAATACTCAG 

GTACTTAAATCGGTAAATATGG 




1061 pb 


4 


gSPAexlOa 


CTCAAGTCTTAGGAATGCAG 


11 1 






gSPAexlOb 


GCACTTAACCAGGCTGTATG 


12j 


551 pb 


3 


gSPAex11a 
gSPAex12m 


CTCAGATGACTCACATAGC 
CTTTACTAGACTAATTCTCCTG 
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13 


1361 pb 


4 


gSPAex13a 


CAGATTCAAGAAGACAGATC 








gSPAex13m 


GCAATAATTCACCACACTTG 








gSPAex13n 


GGTAGTTCTTGTTTCTGCTC 


14 


985 pb 


4 


gSPAex14a 


CAAGTGTGGTGAATTATTGC 








gSPAex14m 


GAGCTGAAAAGTATTCAGC 








gSPAex14n 


TGCAAAGGACATAGCCAGTG 


15 


1076 pb 


1 


gSPAex15a 


AGCCTCTGGAGATAGTATGC 








gSPAex15m 


CTAGAACAGGGGTCACAGTC 








gSPAexl 5n 


TTGGACTTCTTAAACTTC 


16 


1404 pb 


4 


gSPAex16a 


GCAGTATGCAAGAAATTGAAC 








gSPAex16m 


GGCCTGTAA I I I I CTTCTG 








gSPAex16b 


GTACTGAATAGATACATGTAG 


17 


445 pb 


3 


gSPAex17a 


GTGTAGCAGATCAACATAG 








gSPAex17m 


CATCTTCAAGTTTGGTGCAC 



Hormis I'exon 1, amplifie a I'aide du kit Advantage GC genomic PCR kit 
(Clontech) selon les instructions du foumisseur, quatre programmes de PCR 
legerement differents (1, 2, 3 et 4) furent utilises pour amplifier les exons de SPG4 (voir 
5 tableau 2). Les amplifications furent toutes effectuees dans un volume de 50 ul 
contenant 100 ng d'ADN genomique, 50 pmoles de chaque amorce, 250 uM de 
dNTPs, 1X de tampon Takara et 1 unite de Taq polymerase Takara La Taq (Shuzo 
Co.). Les reactions de PCR ont ete realisees selon le precede du « hot start » : la Taq 
polymerase est ajoutee a 94°C apres une premiere etape de denaturation de 5 min a 

10 96°C. Les echantillons sont par la suite soumis a 30 cycles de denaturation (94°C 
pendant 40 sec), d'hybridation (prog. 1 : 60°C pendant 50 sec ; prog. 2, 58°C pendant 
50 sec, prog. 3 et 4 : 55°C pendant 50 sec) et d'elongation (prog. 1 et 4 : 72°C pendant 
1 min, prog. 2 et 3 : 72°C pendant 40 sec), suivis d'une derniere etape d'elongation (10 
min a 72°C). Le sequencage de ces produits de PCR a ete realise sur un sequenceur 

15 ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les 
amorces internes notees « b » et « n » (voir tableau 2). 
4) Caracterisation de SPG4 

Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus 
des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux 
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correspondent a I'orthologue murin de SPG4, ont ete isol's par le consortium IMAGE 
et sequences au laboratoire sur un sequenceur ABI 377 (PE-Applied Biosystems). Afin 
d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les 
collections d'ADNc de differents tissus humains foetaux et adultes, ainsi que de tissus 
5 de souris (panels MTC, Clontech) ont ete testees par PCR selon le protocole du 
foumisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le 
couple SPA_Ca /spam (spam : 5*-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de 
souris. Les conditions de PCR sont celles utilisees pour 1'ampiification de SPG4 a partir 
d'ADNc de lignees de lymphoblastes (cf. § Detection des mutations), excepte que les 
10 echantillons ont 6t6 soumis a 32 cycles pour les ADNc issus de tissus adultes humains 
et de tissus murins, et a 28 cycles pour les ADNc issus de tissus foetaux. Les produits 
d'amplification ont migre par electrophorese sur des gels d'agarose 2 %. 

5) Analyse histologique d'une biopsie musculaire d'un patient 

Les analyses histologiques et histo-enzymatiques ont ete realisees a partir 
15 d'une biopsie musculaire d'un patient issu d'une famille liee au locus SPG4 selon les 
techniques standards decrites dans Casari et al., 1998. 

6) Numeros d'accession dans les bases de donnees publiques 

L'ADNc SPG4 (ou SPAST) et la sequence proteique deduite, GenBank/EMBL 
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gene 

20 SPG4 (ou SPAST), GenBank/EMBL AJ246003. 

Exemole 2 : Analyse de la sequence de I'intervalle SPG4 

L'analyse des evenements de recombinaison a permis de reduire la region 
candidate SPG4 a un intervalle genetique de 0 cM entre les marqueurs D2S352 et 
D2S2347 (19, 20). Une carte de presequencage de Tintervalle SPG4 composee de 37 

25 BACs a ete construite (Hazan et al., sous presse dans Genomics) ; la region candidate 
couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, 
s'etendant sur I'intervalle SPG4 a I'exception d'un unique trou de 4 kb entre les clones 
A et E, ont ete selectionn§s pour etre sequences (Fig. 1 A). Sept de ces BACs (A, B, C, 
D, E, F et G), couvrant approximativement 70 % de la region d'interet, ont deja ete 

30 sequences. Les sequences de ces 7 BACs ont ete comparees a celles des bases de 
donnees nucleiques et proteiques, et analysees avec quatre programmes de prediction 
d'exons. Ces analyses de sequences preliminaires ont permis de mettre en evidence 
14 unites de transcription potentielles, dont trois correspondant aux genes codant pour 
la xanthine deshydrogenase, la steroide 5a-r§ductase 2 et une proteine liant le TGFp. 

35 Sur les 14 genes detectes par ('analyse de sequence, 9 avaient ete prealablement 
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identifies dans les bases de donnees d'EST (pour « Expressed Sequence Tag ») et 
localises au sein de I'intervalle SPG4 (Hazan et al., sous presse dans Genomics) ; les 
5 genes restants n'ont pu etre identifies qu'en sequengant la region candidate. L'un de 
ces 5 nouveaux genes presentait une homologie en 3' de sa region codante avec les 
5 genes codant pour la familte proteique des AAA (Confalonieri et al, 1995). Des 
analyses de sequence plus approfondies ont montre que ce gene, nomme SPG4 (ou 
SPAST), 6tait compost de 17 exons et s'etendait sur une region d'environ 90 kb, 
couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois premiers 
exons predits de ce gene furent identifies dans le BAC D par deux des quatre 

10 programmes de prediction d'exons utilises, GRAIL II et GEN SCAN ; ils presentent une 
forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 demiers 
exons se trouvent dans le BAC G. La sequence prot6ique deduite des exons 7 a 17 est 
significativement homologue a une sous-classe de la famille des AAA, comportant les 
proteines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994) et End 13, 

15 ainsi que la proteine de souris SKD1 (Perier et al., 1994). 

Sur les quatre programmes de prediction d'exons, FGENEH semble le plus 
fiable et le plus puissant, permettant la detection de la plupart des genes de cette 
region chromosomique en 2p21-p22. Cette constatation s'applique egalement au gene 
SPG4 pour lequel 15 exons ont pu etre mis en evidence par ce programme quand 

20 seuls 4, 9 ou 1 1 exons ont pu respectivement etre localises par les programmes Genie, 
GRAIL II et GENSCAN. L'organisation genomique de ce gene (Fig. 1B) a pu etre 
confirmee par la suite gr3ce a la determination de la sequence de I'ADNc SPG4. Les 
jonctions introns/exons sont representees sur le tableau 3 ci-apres : la taille des exons 
varie de 41 pb (exon 16) d 1,410 kb (exon 17), celle des introns variant de 140 pb 

25 (intron11)a23,247kb(intron1). 
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Exemple 3 : Identification de I'ADNc SPG4 

Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent realisees 
sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de 
caracteriser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donne des produits 
5 d'amplification se terminant a la position nt 263 de I'ADNc SPG4 (Fig. 2), ce qui etait 
probablement du au contenu riche en GC de la region 5' du transcrit (90 % de GC dans 
les 60 pb precedant la position nt 263). Quatre produits de PCR chevauchants, recouvrant 
la totalite de la region codante, ont ete amplifies a partir des ADNc issus des 
lymphoblastes de six individus controles et sequences integratement dans le but de 

10 verifier la sequence du transcrit SPG4. L'alignement des sequences de tous les produits 
de PCR et RACE-PCR a permis de reconstituer une sequence de 3263 pb comprenant 
une phase ouverte de lecture de 1848 pb precedee par une region 5* non traduite (5* UTR 
pour « 5* UnTranslated Region ») de 125 pb et suivie par une region 3' UTR de 1290 pb 
incluant un site de polyadenylation entre les positions nt 3227-3232, ~ 35 pb en amont de 

15 la queue polyA (Fig. 2). La comparaison de la sequence de I'ADNc SPG4 avec les 
banques de donnees d'ESTs a permis de detecter une homologie significative avec 6 
ESTs humains dont TEST N47973 qui contient une region 3' non codante plus etendue 
(+ 180 pb) comprenant un deuxieme site de polyadenylation. Le site d'initiation de la 
traduction a ete identifie par la presence d'une sequence consensus de Kosak 

20 (CTGTGAatgA) definie comme un «contexte adequat» a Pinitiation de la traduction 
attendu qu'une purine est localisee 3 nt en amont de I'ATG initiateur, lui-meme precede 
d'un codon STOP. La sequence de I'ADNc de 3263 pb est identique a la sequence 
transcrite deduite des 17 exons du gene SPG4. L'analyse de la sequence de la region 5' 
a Tatde des programmes informatiques TSSG et TSSW suggere la presence d'une 

25 sequence promotrice de type TATA box situee 43 pb en amont de la position nt 1 de 
I'exon 1 . 

Exemple 4 : Mutations dans le gene SPG4 

Des mutations heteYozygotes ont ete recherchees dans I'ADNc SPG4 provenant 
de lymphoblastes de 14 patients issus de families liees au locus SPG4 (1 individu atteint 

30 par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase 
ouverte de lecture de I'ADNc SPG4 ont ete amplifies et sequences chez les 14 patients 
ainsi que chez 6 individus sains controles. L'electrophorese sur gel agarose du fragment 
de PCR IV a montre trois bandes d'intensite egale chez 3 patients des families 2992, 
5226 et 5330 provenant de la meme region de Suisse, ce qui suggerait une microdeletion 

35 ou une mutation d'un site d'epissage ; les deux bandes supplementaires n'etaient pas 
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preserves chez 2 individus sains issus des families 2992 et 5330 (Fig. 3A). La sequence 
genomique de I* xon 16 a revele une mutation heterozygote A->G du site accepteur 
d'epissage (AG) de I'intron 15 chez ies individus atteints de ces trois families (Fig. 3B) ; 
cette mutation engendre la perte de I'exon 16 suivie d f un decalage de la phase de lecture 
dans le transcrit anormal. Aucun des membres sains incluant maris et epouses ne porte 
cette mutation du site d'epissage. ^identification de la meme mutation chez tous Ies 
^embres atteints de ces trois families suisses demontre I'existence d'un ancetre 
mun, ce ji avait ete prealablement suggere par I'etude des haplotypes. 

Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent 
des substitutions d'un acide amine dans la sequence proteique (S362C, C448Y et 
R499C) ont ete respectivement mises en evidence par le s6quencage des fragments de 
PCR III et IV chez Ies individus atteints des families 624, 4014 et 618. Ces trois 
substitutions impliquent toutes un residu cysteine, induisant la perte ou I'insertion d'une 
cysteine dans la sequence proteique. Une deletion de 1 pb, 1520deIT, qui cree 

15 I'apparition d'un codon STOP induisant une proteine tronquee composee de 465 acides 
amines (aa) a ete detectee chez Ies individus atteints de la famille A. Aucune des cinq 
mutations resumees dans le tableau 4 ci-apres n'a ete trouvee chez Ies individus 
controles testes, qu'ils appartiennent a la fratrie saine ou aux conjoints des sept families 
analysees ici. Ces cinq mutations affectent de fa^on importante la sequence proteique 

20 dans un domaine trds conserve, ou cassette AAA (Beyer, 1997), qui est compose de 
plusieurs motifs proteiques supposes etre respohsables de Tactivite ATPase chez tous Ies 
membres de la famille des AAA. 
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En addition a ces cinq mutations decrites precedemment, des recherches de 
mutations heterozygotes realises sur des patients atteints de PSF-AD issus de 36 autres 
families ont permis de mettre en evidence 34 autres mutations alterant ou susceptibles 
d'alterer le produit d'expression du gene SPG4. 
5 Les caracteristiques de ces 34 autres mutations sont resumees dans le tableau 5 

ci-apres dans lequel ont ete egalement inserees les cinq premieres mutations 
precedemment citees. 
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Tabl au5 

Mutations dans SPG4 chez les patients atteints de PSF-AD 



Famille 



Localisation 



Mutation u 



Changement d'acide amine 



Consequence 



624 

6958 

214 

1002 

027 

019 

4014 

148 

618 

636 

627 



exon 7 
exon 8 
exon 8 
exon 8 
exon 8 
exon 10 
exon 11 
exon 11 
exon 13 
exon 15 
exon 15 



1210Ci->G 
1233 GhA 
1267Tt-»G 
1283Th->G 
1288 A t->G 
1401 Ci-Kj 
1468Gh-»A 
1504Gi->T 
1620 Ch^T 
1788Gh-»A 
1792Ch-»T 



S362C 
G370R 
F381C 
N386K 
K388R 
L426V 
C448Y 
R460L 
R499C 
D555N 
A556V 



faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 
faux sens 



2971 

3655 

1010 

3938 

6922 

616 

605 



030 

615 

042 

032 

189 

3686 

625 

A 

115 

3266 

149 

645 



029 

162 

125 

143 

1620 

1006 

1605 

1012 

1626 

2992 

5226 

5330 

1611 



exon 3 
exon 5 
exon 5 
exon 5 
exon 10 
exon 10 
exon 15 



exon 2 
exon 5 
exon 5 
exon 5 
exon 9 
exon 9 
exon 9 
exon 1 1 
exon 12 
exon 13 
exon 14 
exon 14 



intron 4 
intron 6 
intron 7 
intron 8 
intron 1 1 
intron 1 1 
intron 13 
intron 13 
intron 15 
intron 15 
intron 15 
intron 15 
intron 16 



702Ch»T 
873 Ah>T 
907 Ci-» A 
932Ch>G 
1416Ch->T 
1416 Ch»T 
1809Ci-»T 



Q193STOP 
K229STOP 
S261STOP 
Y269STOP 
R431STOP 
R431STOP 
R562STOP 



578-579insA 

852delll 

882-883insA 

906delT 

1299delG 

1340del5 

1340del5 

1520delT 

1574delGG 

1634del22 

1684-1685insTT 

1685del4 



PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 
PTC + 



2aa 
18 aa 
12 aa 

17 aa 
3 aa 
35 aa 
35 aa 
7aa 
2 aa 

18 aa 
9aa 
7aa 



808-2 a h->g 
1129+2 tn^g 
1223+1 gnt 
1299+1 gi-»a 
1538+5 gi->a 
1538+3 del4 
1661+1 gh->t 
1662-2 an* 
1812+1 gi-)a 
1813-2 aHg 
1813-2 a h^g 
1813-2 a i->g 
1853+1 gHa 



non sens 
non sens 
non sens 
non sens 
non sens 
non sens 
non sens 



decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 
decalage 



+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 
+ non sens 



? 
? 

? 
? 

(PTC + 6 aa) 

? 
? 
? 
? 

A aa564 h> aa576 (PTC+7 aa) 
A aa564 h-> aa576 (PTC+7 aa) 
A aa564 h> aa576 (PTC+7 aa) 



mutation site d'epissage 
mutation site d'epissage 
mutation site d'epissage 
mutation site d'epissage 
perte de l'exon 11 + decalage 
mutation site d'epissage 
mutation site d'epissage 
mutation site d'epissage 
mutation site d'epissage 
perte de l'exon 16 + decalage 
perte de l'exon 16 + decalage 
perte de l'exon 16 + decalage 
mutation site d'epissage 



8 Les positions en nt font reference a la sequence de TADNc SPG4. b Les positions en aa font reference a la 
sequence de la spastin. Les bases des exons sont indiquees en majuscules, celles des introns en minuscules. 
PTC+n aa - "premature termination codon" a n acide amine en aval de la mutation. 
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Exemple 5 : Analyse de la sequence proteique de la spastin 

La phase ouverte de lecture de SPG4 code pour une proteine de 616 aa que nous 
avons nommee spastin et dont le poids moleculaire est d'environ 67,2 kDaltons (kD). La 
comparaison de cette sequence en acides amines dans les bases de donnees proteiques 
5 a Taide des programmes BLAST a permis de mettre en evidence une zone de forte 
homologie avec plusieurs membres de la famitle des AAA a I'extremite C-terminale de la 
spastin. Les motifs « types » de la famille des AAA, englobes dans la cassette AAA, sont 
localises entre tes positions aa342 et aa599 (voir Fig. 2) d'apres les comparaisons de 
sequence dans les bases de donnees de domaines proteiques ProDom et Prosite. Les 

10 trois domaines types conserves, dont les motifs A et B de Walker ainsi que le motif 
consensus minimal des proteines AAA sont respectivement situes au sein de la cassette 
AAA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, « 
GPPGNGKT » appele egalement p-loop (ou boucle-p) qui correspond au domaine de 
fixation de I'ATP et le motif B « II FIDE » sont tres conserves entre tous les membres de la 

15 famille des AAA incluant la spastin. 

La comparaison des cassettes AAA presentes dans 150 proteines de cette famille 
d'ATPase issues d'organismes tres eloignes dans revolution a permis de classifier cet 
ensemble de proteines en plusieurs sous-groupes, en fonction du nombre de cassettes 
AAA identifies (1 ou 2) et des homologies de sequence entre ces differentes cassettes 

20 (Beyer, 1997). Parmi toutes les proteines de la famille des AAA, la spastin presente une 
plus forte homologie avec une sous-classe particuliere. des AAA, et plus specifiquement 
avec les proteines suivantes dont la plupart ont ete identifies grace au sequencage 
complet du genome de Torganisme considere : deux proteines de Caenorhabditis elegans 
016299 et Q18128, deux sous-unites du proteasome 26S de Saccharomyces cerevisiae 

25 Yta6p (Q02845) et TBP6 (P40328) (Schnall et at., 1994), une sous-unite du proteasome 
de Schizosaccharomyces pombe (O43078), les proteines SAP1 (P39955) et END13 
(P52917) de S. cerevisiae et la proteine murine SKD1 (P46467) (Perier et al., 1994). 
L'alignement multiple de ces 8 proteines avec la spastin est represents sur la Fig. 4A. Sur 
les 257 acides amines englobant la cassette AAA (positions aa342-599), la spastin 

30 presente une identite de sequence de 52 %, 51 % et 50 % avec la proteine de levure 
Yta6p (Q02845), la proteine de nematode 016299 et la proteine de levure TBP6 (P40328) 
respectivement Des resuttats similaires nt ete obtenus par I'analyse de la sequence 
proteique de la spastin dans la base de donnees ProDom qui a montre I'existence de trois 
domaines d'homologie (nommes 92, 179 et 6226 et correspondant aux positions aa342- 

35 409, aa41 1-509 et aa51 2-599) trouves dans les sous-unites putatives du proteasome 26S 
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de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent 
des motifs de type leucine-zipper dont deux ont pu etre detectes dans ta sequence 
proteique de ta spastin aux positions aa50-78 et aa508-529 par I'analyse de la sequence 
dans la base de donnees Prosite (voir Fig. 2). Cette analyse a egalement pu predire la 
5 presence d'un motif de dimerisation de type helice-boucle-helice (« helix-loop-helix ») 
situe entre les positions aa478 et aa486. 

La comparaison de la sequence proteique de la spastin avec celles d s 
metalloproteases mitochondriaies comme les proteines de levure AFG3, RCA1 et YME1 , 
ainsi que la paraplegin qui est impliquee dans une forme rare de PSF-AR montre que 

10 I'homologie entre ces cinq membres de la famille des AAA est limitee a la region de 
257aa englobant la cassette AAA (Fig. 4B). Dans cette region, I'identite de sequence 
entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et la proteine 
de levure AFG3 sont identiques a 57 % sur cette meme portion de la sequence proteique. 
Cette comparaison de sequence suggere que la spastin n'appartient pas au meme sous- 

15 groupe des AAA que la paraplegin et autres metalloproteases mitochondriaies. De plus, 
I'analyse informatique de la sequence de la spastin avec le programme PSORT II qui 
permet de predire la localisation sub-cellulaire des proteines semble indiquer que le 
spastin est une proteine nucleaire. Un eventuel signal de localisation nucleaire (NLS pour 
« Nuclear Localization Signal ») t RGKKK, a ete mis en evidence entre les positions aa7 et 

20 aa11 alors qu'aucun peptide signal caracteristique d'un import dans la mitochondrie n'a 
pu etre decele, contrairement a ce qui avait ete observe pour la paraplegin. 
Exemole 6 : Profils d'expression de SPG4 et de son orthologue murin Spq4 

La comparaison de la sequence nucleique de SPG4 dans les banques de donnees 
d f EST a permis de detecter plusieurs ESTs humains, murins et de rat presentant une forte 

25 homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris 
correspondant a deux des ESTs murins, AA560327 et AA107866, ont ete obtenus du 
consortium IMAGE et sequences integratement. L'assemblage des sequences de ces 
clones d'ADNc a permis de reconstituer une sequence consensus de 1689 pb incluant 
une phase ouverte de lecture incomplete de 1514 pb. La comparaison entre TADNc SPG4 

30 humain et cet ADNc de souris a montre qu'il manque au transcrit murin environ 460 pb a 
I'extremite 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de 
souris est suivie d'une region 3' non codante (3* UTR) de 175 pb contenant un site de 
polyadenylation situe £ ~20 pb en amont de la queue polyA (Fig. 5). La sequence 
nucleique de SPG4 et la sequence proteique de la spastin humaine presentent 

35 respectivement une identite de 89 % (entre les positions nt 460 et nt 1982) et de 96 % 
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(entre les positions aa113 et aa616) avec les sequences de I'ADNc et de la prot'ine 
deduite de la souris. Ce degre important d'homologie permet d'affirmer que ce transcrit de 
souris correspond a I'orthologue murin de SPG4, qui a ete done baptise Spg4. 

L'hybridation de northern blots comprenant les ARNm de divers tissus humains et 
5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donne de resultats 
probants excepte une tres faible bande correspondant a un transcrit de 2,5 kb dans le 
testicule de souris apres 10 jours d'exposition. En raison du faible niveau. d'expression de 
ce gene, les profils d'expression de SPG4 et Spg4 ont ete determines par des 
experiences de PCR sur des collections d'ADNc normalisees provenant de divers tissus 

10 adultes et foetaux (voir Fig. 6A a 6C). Le gene murin Spg4 est exprime de facon 
ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de 
I'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a ete detectee dans le 
foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de I'embryon. 
L'expression precoce de Spg4 au cours du developpement embryonnaire a ete confirmee 

15 par la presence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et 
de carcinome embryonnaire dans les banques de donnees publiques d'ESTs. Le gene 
humain SPG4 est lui aussi exprime de facon ubiquitaire dans les tissus adultes (Fig. 6B) 
et foetaux (Fig. 6C), avec une expression peut-etre plus marquee dans le cerveau foetal. 
Exemple 7 : Pas de defaut de la phosphorylation oxvdative dans la PSF-AD liee au locus 

20 SPG4 

Afin de determiner si des mutations de la spastin induisaient un defaut de la 
phosphorylation oxydative (OXPHOS) dans la mitochondria a I'image de ce qui avait ete 
observe pour la paraplegia une biopsie musculaire a ete realisee sur un patient d'une des 
families de PSF-AD liee au locus SPG4. Les analyses morphologiques et histo- 

25 enzymatiques de cette biopsie de muscle n'ont pas revele de fibre musculaire de type 
RRF (pour « ragged red fibers »), caracteristique des defauts OXPHOS dans la 
mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que la 
prediction d'une localisation nucleaire de la spastin semblent indiquer que la PSF-AD liee 
au locus SPG4 n'est pas une maladie mitochondriaie de type OXPHOS, par opposition a 

30 la PSF-AR liee au locus SPG7. 

Par une approche de clonage positionnet basee sur le sequencage d'une region 
de 1,5 Mb, nous avons identrfie le gene SPG4 (ou SPAST) responsable de la forme la 
plus frequente de PSF-AD, prealablement localise sur les bandes chromosomiques 2p21- 
35 p22. Trente-neuf mutations alterant ou susceptibles d'aiterer I produrt du gene, nomme 
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spastin, ont pu etre detectees chez les individus atteints de quarante-et-une families de 
PSF-AD presentant une liaison au I cus SPG4. La spastin est un nouveau membre de la 
famille des proteines AAA, dont la localisation semble etre nucleaire et qui presente une 
forte homologie avec les sous-unites du proteasome 26S de levure. En depit d'une 
5 grande homologie restreinte a un domaine de 230 a 250 aa t dite cassette AAA, les 
nombreux membres de cette famille proteique peuvent participer a des mecanismes 
cellutaires tres varies comme le transport de proteines au sein de vesica les, la regulation 
du cycle celiulaire, la biogenese des organelles, ie controle de la transcription, .... 
Toutefois, tous ces mecanismes cellutaires impliquent ('assemblage, la fonction ou la 
10 degradation de complexes proteiques, ce qui suggere que les membres de la famille des 
AAA sont des proteines dites « chaperons ». 
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REVENDICATIONS 

1. Acide nucleique purifie ou isole du gene SPG4, caracterise en ce qu'il 
comprend une sequence choisie parmi le groupe comprenant : 

5 a) la sequence SEQ ID No. 1, la sequence SEQ ID No. 2, la sequence SEQ ID No. 72, la 
sequence la sequence SEQ ID No. 106 ou la sequence d'au moins 15 nucleotides 
consecutifs d'une de ces sequences ; 

les sequences nucleiques homologues ou variantes des sequences SEQ ID No. 1, 
SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et 
c) la sequence complementaire ou la sequence de TARN correspondant aux sequences 
telies que definies en a) et b). 

2. Acide nucleique purifie ou isole selon la revendication 1, a ('exception de 
Tacide nucleique identifie dans la banque de donnees GenBank sous le numero 
d'accession AB029006. 

15 3. Acide nucleique purifie ou isole selon la revendication 1 ou 2, caracterise 

en ce qu'il comprend au moins une sequence d'au moins 15 nucleotides consecutifs, du 
fragment nt 714-809, extremites incluses, de la sequence SEQ ID No. 2, de sa sequence 
complementaire ou de la sequence de son ARN correspondant. 

4. Acide nucleique purifie ou isole selon Tune des revendications 1 a 3, 
20 caracterise en ce qu'il comprend une mutation correspondant a un polymorphisme naturel 

chez rHomme. 

5. Sonde ou amorce, caracterisee en ce qu'elle comprend une sequence d'un 
acide nucleique selon Tune des revendications 1 a 4. 

6. Sonde ou amorce selon la revendication 5, caracterisee en ce qu sa 
25 sequence est choisie parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 

7. Site accepteur ou donneur d'epissage, caracterise en ce qu'il comprend 
une sequence d'un acide nucleique selon la revendication 1 choisie parmi les sequences 
SEQ ID No. 74 a SEQ ID No. 105. 

8. Methode pour le criblage de banques d'ADNc ou d'ADN genomique ou 
30 pour le clonage d'ADNc ou genomique isole codant pour la spastin, caracterisee en ce 

qu'elle met en ceuvre une sequence nucleique selon Tune des revendications 1 a 7. 

9. Methode selon la revendication 8, pour ['identification de la sequence 
genomique ou de I'ADNc du gene SPG4 de mammifere, notamment de souris. 
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10. Methode pour ridentification de mutation portee par le gene SPG4 humain, 
caracteris'e en ce qu'elle met en oeuvre une sequence nucleique seion Tune des 
revendications 1 a 7. 

11. Methode seion la revendication 10, pour ridentification de mutation 
5 responsable de la paraplegie spastique familiale autosomique dominante. 

12. Methode pour ridentification des sequences d'acide nucleique promotrices 
et/ou regulatrices de rexpression du gene SPG4, caracterisee en ce quelle met en oeuvre 
une sequence nucleique seion rune des revendications 1 & 7. 

13. Acide nucleique identifie par une methode seion rune des revendications 9 

10 a 12. 

14. Polypeptide code par un acide nucleique seion I'une des revendications 1 a 

4 et 13. 

15. Polypeptide seion la revendication 14, de preference a rexception du 
peptide de 584 acides amines dont la sequence est identifiee dans la banque de donnees 

15 GenBank sous le numero d'accession AB029006. 

16. Polypeptide seion la revendication 14 ou 15, caracterise en ce qu'il 
comprend une sequence d'acides amines choisie parmi le groupe comprenant : 

a) la sequence SEQ ID No. 3, la sequence SEQ ID No. 73, la sequence SEQ ID No. 107 
ou la sequence d'au moins 10 acides amines consecutifs d'une de ces sequences ; et 
20 b) les sequences homologues ou variantes des sequences SEQ ID No. 3, SEQ ID No. 73 
ou SEQ ID No. 107. 

17. Polypeptide seion la revendication 14 ou 15, caracterise en ce qu'il 
comprend la sequence d'au moins 8 acides amines consecutifs de la sequence du 
fragment aa 197-228, extr6mites incluses, de la sequence SEQ ID No. 3. 

25 18. Polypeptide seion la revendication 14 ou 15, caracterise en ce qu'il 

comprend une sequence d'acides amines choisie parmi le groupe comprenant la 
sequence SEQ ID No. 3, la sequence SEQ ID No. 73, la sequence SEQ ID No. 107, 
lesquelles sequences portant au moins une des mutations correspondant a un 
polymorphisme naturel chez I'Homme, et les sequences de leurs fragments d'au moins 10 

30 acides amines consecutifs. 

19. Vecteur de clonage et/ou d'expression contenant une sequence d'acide 
nucleique seion I'une des revendications 1 a 4, et 13. 

20. Vecteur seion la revendication 19, caracterise en ce qu'il comporte les 
elements necessaires £ son expression dans une cellule hote. 

35 21 . Cellule hote transformee par un vecteur seion la revendication 19 ou 20. 



WO 01/18198 



PCT/FR00/02433 



47 

22. Mammifere, excepts 1'Homme, caracteris ' en ce qu'il comprend une cellule 
selon la revendication 21. 

23. Mammifere, excepts PHomme, selon la revendication 22, comprenant une 
cellule transform^, caracteris6 en ce que la sequence de Tun au moins des deux alleles 

5 du gene SPG4 contient une au moins des mutations correspondant a un polymorphism 
nature! chez THomme ou identifies par une mdthode selon la revendication 10 ou 1 1. 

24. Utilisation d'une sequence d'acide nucleique selon Tune des revendications 
5, 6 et 13 comme sonde ou amorce, pour la detection et/ou ^amplification de sequences 
d'acide nucleique. 

1° 25. Utilisation d'une sequence d'acide nucleique selon Tune des revendications 

1 a 7, et 13, pour le criblage de banque g6nomique ou d'ADNc. 

26. Utilisation d'une sequence d'acide nucteique selon Tune des revendications 
1 a 4, et 13, pour la production d'un polypeptide recombinant ou synth6tique. 

27. MSthode de production d'un polypeptide recombinant, caracterisee en ce 
15 que Ton cultive une cellule transform^ selon la revendication 21 dans des conditions 

permettant I'expression dudit polypeptide recombinant et que Ton recupere ledit 
polypeptide recombinant 

28. Polypeptide, caract6ris6 en ce qu'il est obtenu par une methode selon la 
revendication 27. 

20 29. Anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimSriques 

ou immunoconjugues, caracterisSs en ce qu'ils sont capables de reconnaTtre 
sp^cifiquement un polypeptide selon I'une des revendications 14 a 18, et 28. 

30. Methode pour la detection et/ou la purification d'un polypeptide selon I'une 
des revendications 14 £ 18, et 28, caracterisee en ce qu'elle met en oeuvre un anticorps 

25 selon la revendication 29. 

31. MSthode de diagnostic gSnotypique de la PSF-AQ associee au gdne 
SPG4, caracterisee en ce que I'on met en oeuvre une sequence d'acide nucleique selon 
I'une des revendications 1 d 7, et 13. 

32. Methode de diagnostic genotypique de PSF-AD associee a la presence 
30 d'au moins une mutation sur une sequence du g6ne SPG4 a partir d'un pr6l6vement 

biologique d'un patient caracterisee en ce qu'elle comporte les 6tapes suivantes : 
a) le cas 6ch§ant, isolement de I'ADN gSnomique £ partir de I'echantillon biologique £ 
analyser, ou obtention d'ADNc a partir de I'ARN de P "chantillon biologique ; 
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b) amplification specifique de ladite sequence d'ADN du gene SPG4 susceptible de 
contenir une mutation a I'aide d'amorces selon Tune des revendications 5 et 6 ou d'un 
acide nucleique selon fa revendication 13 ; 

c) analyse des produfts d'amplification obtenus et comparaison de (eur sequence avec la 
5 sequence normale correspondante du gene SPG4. 

33. Methode de diagnostic de la PSF-AD associee a une expression anormale 
d'un polypeptide code par le gene SPG4, caracterisee en ce que I'on met eh contact un 
i des anticorps selon la revendication 29 avec le materiel biologique a tester, dans des 
itions permettant la formation eventuelle de complexes immunologiques specifiques 
. (edit polypeptide et le ou lesdits anticorps, et en ce que Ton detecte et/ou quantifie 
^s complexes immunologiques eventuellement formes. 

A. Methode de selection d'un compose chimique ou biochimique capable 
d'interagir directement ou indirectement avec un polypeptide selon Tune des 
revendications 14 a 18, et 28, ou avec un acide nucleique selon J'une des revendications 
15 1 a 7, et 13, et/ou permettant de moduler I'expression ou I'activite de ces polypeptides, 
caracterisee en ce qu'eile comprend la mise en contact d'une sequence d'acide nucleique 
seton Tune des revendications 1 a 7, et 13, d'un polypeptide selon Tune des 
revendications 14 a 18, et 28, d'un vecteur selon 1'une des revendications 19 et 20, d'une 
cellule selon la revendication 21, d'un mammifere selon Tune des revendications 22 et 23 
20 ou d'un anticorps selon la revendication 29, avec un compose candidat et, la detection 
d'une modification de I'activite dudit polypeptide. 

35. Utilisation d'une sequence d'acide nucleique selon Tune des revendications 
1 a 7, et 13, d'un polypeptide selon Tune des revendications 14 a 18, et 28, d'un vecteur 
selon Tune des revendications 19 et 20, d'une cellule selon la revendication 21, d'un 

25 mammifere selon Tune des revendications 22 et 23 ou d'un anticorps selon la 
revendication 29, pour I'etude de I'expression ou de I'activite du gene SPG4. 

36. Trousse ou necessaire pour le diagnostic, caracterisee en ce qu'eile 
comprend au moins un compose choisi parmi le groupe de composes suivant : 

a) un acide nucleique seton ('une des revendications 5 et 6 ; et 
30 b) un anticorps selon la revendication 29. 
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|gctcctgagaccggcggg<^cacgggggtctgtggcccccgccgtagcagtc 9 s 

1 TTATGGCGGCGGCGGCAGTGAGAGCTGTGAATGAATTCTCCGGGTGGACGAGGG 190 
1 MHSPGGRGKKKGSGGASNPVPP 

CAGGCCTCCGCCCCCTTGCCTGGCrcCCGCC^ 285 
23 RPPPPCLAPAPPAAGPAPPPES PHKRNLYY F S 

CCTACCCGCTGTTTGTAGCCTTCGCGCTGCTGCGTTTGXJTCGOCTT^ 380 
55 YPLFVGFALLRLVAFHLGLLFVWLCQRFSRA 

CTCATGGCAGCCAAGAGGAGCTCCGOGGCCGCGCCAGCACCTGCC^ 475 

86 lmaakrssgaapap asasapapvpggeaervr 

agtcttccacaaacaggccttcgagtacatctccattgccctgcgc^ 570 
118 vfhkqapetis ialridedeka2gqkeqavbwy 

ataagaaaggtattgaagaactggaaaaaggaatagctgttatagttacaggacaagj^^ 665 
iso k k g i ee lekg x avivtgqg3eqc erarrlqak 

atgatgactaatttggttatggccaaggaccgcttacaacttctag|^ 760 
181 mmtnlvmakdrlqlle4kmqpvlpfsksqtdvy 

taatgacagtactaacttggcatgccgcaatggacatctc^ 855 

213 NDSTNLACRHGHLQS E5 SGAVPKRKDPLTHTSN 

ATTCACTGC<ntXJTTXIAAAAACAGTTATGAAAACTG^ 950 
245 SLPRSKTVMKTGSAG LSGHHRAPSTSGLSMV 

TCTGGAGTGAAACAGGGATCTGGTCCTG<^KXrrACCACTCATAA 104 5 
276 SGVKQGSGPAPTTHKG6TPKTHRTNKPSTPTTA 

TACTCGTAAGAAAAAAGACTTGAAGAATTTTAGGAATGTGGACAG<^ 114 0 
308 TRKKKDLKNFRNVDSNLAHL IMNE IVDNG7TAV 

TTAAATTTGATGATATAGCTGGTCAAGACTTGGCAAAACAAGCATTGCAAGA 1235 
340 RFDD I AGQDLAKQALQEIVILPSLRPEL8FTG 

cttagagctcktgccagagggctgttactctttggtc^ 1330 
371 lraparglllf gpp gwgkt mla9kavaaesnat 

cttctttaatataagtgctgcaagtttaacttcaaaata^Stc 14 25 
403 ffhisaasltsky v10g egeklvralfavarelo 

AACCTTCTATAATTTTTATAg|vTGAAGTTGATAG 1520 
435 P S I I F I DUE VDSLLCERREGEHDASRRLKTEF 

CTAATAGAATTTGATGGTfjTACAGTCTGCTGGAGATGACAGAGTACTTGT 1615 
466 L I E F D G V12Q S A G D D R VL VHCATHRPQELDEAVL 

CAGfc<XTTTCATCAAACGG«TATATCTGTCTTTACCAAATGAGGAG^ 1710 
_P13R FIKRVYVSLPNEE T14R LLLLKNLLCKQGS PL 

TGACCCAAAAAG AACTAGCACAACTTGCT AGflATG ACTGATGGAT ACTCAGG AAGTG ACCTAACAGCTTTGGCAAAAG ATGCAGCACTGGGTCCT 1 B 0 5 
530 TQKELAQLAR HIST DGYSGSDLTALAKDAALGP 

ATCCGAGjwCTAAAA<XAGAACflC<;rCAAGAATATGTCIW 1900 
561 I R E16L KPEQVKNMSASE M17 R HIRLSDFTESLKKI 

AAAACGCAGCGTCAGCCCTCAAACTTTAGAAGCGTACATACGTTGGAACAAGGACT^ 19 95 
593 KRSVS PQTLEAYIRWNKDFGDTTV* 

TGCAGAACATTTTACTTAAAAGAGGAAACACAAGATCTTCAATGAACGTCATCGGCTA 209 0 

T ACATATTTGTGCACCAAACTTGAAGATG AACCAG AAAACAG ACTTAAACAAAATAT AC AATGCAAATGTAATTTTTTGTTGTTTAAGGCCTTGC 2185 

CTTCATGGTCACAGTTATCCCAATGGACACTAAGTTAGAGCACAACAAAACC 2280 

AATTTGTATATTGTGTTGCAG ATGAAAG T ATTCCAGG AAC AGTG AATGGTAG AAG AC ACAAGAACATTTGTTTGTTTGTCTTCTC 2375 

TTAAAATAGTAATTTCTCCTACTTTTCTTTTCTACTGTTGTCTTAACT 2470 

GTTTTATAAATTCAGTGTGCCAAATGAAACTTTT 2565 

GACATTAAACAATTGTTCTGTTCTTTTTACCTTTTATTTTTCTACT 2660 

TATGGTAAAATAGAGAAGGTTTGAAGGT1TCAGTTACTCTGTCATATAACATC 2755 

GTATTTGTCAGAAATCTGTTGTAGACTGTTAACTTCTTCCTGATGGAATTTATTTTCTGCA^ 2850 

ACTGCTGTGAAAATGTTTCCAGTGCAAGAGAAGGGAAATACTAGGAACTAAGACA 2945 

TAATTATAAGCAAGTKXSAACTACCATCTTTTATTCTTAATAAT^ 3040 

ACATTTTTCTAGTTCCTTCTGCTTGCTTTATTAACTCAAAAGTTCTAGTTCTAGTCT^ 3135 

TCCATTTGTTTGTATAAATATGCCTGCATTTTCATTATA 3230 
AAGGCAAATAGATATTTGCCCTTAGTTTACTGG 3263 
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aaaaactggc atcaaactaa atatccatca atagttgaac agtaaaatag gttgtggtaa 6660 

attcatataa tggaatacta tatagcagtg aaaatgtacc acagttatag aaatcaacag 6720 

ggaggaattt caacacttaa ttattaagta ggtagccagg catagcggtt tatgcctgta 6780 

atcccagcac tttgggagac caagacagga ggattacttg agcccagggg ttcgagatca 6840 
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acctgggcaa 
aaattttgag 
tcaaagtgag 
aaaaatgaga 
gagacaagac 
catttttctt 
cacttcttgt 
ctcttgttgc 
ctgggttcaa 
caeca tgccc 
ctggtctcga 
ttacaggtgt 
aaaaaaattt 
tgcattggca 
gcctcagcct 
tctaactttt 
actcctgacc 
agccaccaca 
aagggggagc 
tgtagggcag 
tgtaatccca 
accaacctgg 
ggcgcgatgg 
ttgettgage 
aagaatacaa 
gctgaggtgg 
gcgccactgc 
aagctgtggc 
cctcacattg 
agaaataatt 
tagagagaga 
gagagaaaca 
gtcaggaacc 
gagcactcgt 
ggagaatctg 
gctcattaga 
gtagattaaa 
ctaagatttc 
tttagttaaa 
tgtttgcagt 
gattttaaat 
gagtgcagtg 
tccggcctta 
ttaattccca 
ttaggtcgee 
agectagega 
gaaggcttcc 
actgtagttg 
caacaaagac 
gcggccgccg 
gagccaccga 
ggggccggcg 
ctgtggcccc 
ggcgggttat 
aagaagaaag 
ctggcccccg 
aacctgtact 
ttccacctgg 
gecaagagga 



cagtgagact 
gagggaaagc 
gcaaaatcat 
cactagaatg 
attgagatta 
aaatggaatg 
ttatatgata 
ccaggctgga 
gtgattctcc 
ggctagtttt 
actcccgacc 
gagccaccgt 
tttgttgttt 
tgatcttggc 
cgcactagtt 
gtatttttag 
teeggtgate 
cccggccgaa 
aataagaggg 
tactggcggg 
gcactttggg 
gaaacatagc 
ggtggctcat 
ccaggagttg 
aaattagtcg 
aaggatcacc 
actccagcct 
agaatgtgga 
taaataaegg 
atggctaact 
gggagagaga 
gagaaacaga 
cagcagctct 
ttccagttac 
actgacctag 
atacagggag 
aaaaaagtgt 
ccttattcaa 
cccctgggtt 
gacctgaagt 
ttttatttta 
gcgcgatctc 
gccttccaac 
gattgatatc 
tggcagaaaa 
accagcagag 
tggcaggagc 
agtgggaaag 
gcgccgtgcg 
ctgggagcca 
ctgeaggagg 
ggcagcgtgc 
cgccgtagca 
ggcggcggcg 
gctccggcgg 
cccctcccgc 
atttctccta 
ggctcctctt 
gctccggggc 



ccatctctat 
aaacaaggga 
acaagacatt 
attaatataa 
gggaggagct 
ctgettatta 
tatgtataaa 
gtgcaatggc 
tgcctcagcc 
gtatttttaa 
tcaggtgatc 
gccaggccct 
gcttttgaga 
tcaccgcggc 
gagattacag 
tatagaggga 
tgctcgcctc 
agagggcatt 
aaacagggag 
gaataattaa 
aggecgagge 
aagaccctgt 
gectgtaate 
gagaccagcc 
ggcccagtgg 
tgagccaggg 
gggcaatgga 
gattcttgga 
agtcttttta 
caagtaaaaa 
ggaaaagacg 
ctgattagtg 
gggggagctc 
tttctattcg 
tgtttgcttc 
cagagacaag 
agattcttca 
ataaattatc 
agttgatctc 
ttcttatctt 
ttttttctgg 
agctcacttg 
cagctgggac 
cattgettet 
agatgaaaga 
cgaccccaag 
tctccagggc 
ccgagaggcg 
cgcgcgcgcc 
ccaggcggcg 
agaaggggtt 
ggcagtgcgg 
gtggctgccg 
gcagtgagag 
cgccagcaac 
cgccgggccg 
cccgctgttt 
cgtgtggctc 
cgcgccagca 



tttcttaaaa 
tacttgaaat 
gtttagaaat 
aattcaggat 
cacagagtgc 
tttttcttta 
tgtaattttt 
actatcttgg 
tcccgagtag 
tagagaaagg 
cgcctgcctt 
gaatcagatt 
cagagtctcg 
ctcagcctcc 
gaatgeacca 
gttttgecat 
ggctcccaaa 
tcagaatgag 
taggtcattt 
gtaaaattgg 
gggcaggttg 
ctcaacaaaa 
ccaacacttt 
tgggcaacat 
cgtgtgcctg 
. aggtggaggt 
gtgaaaccct 
agctggaagc 
tcagtttggc 
gagaaagaga 
aaaggaagga 
tattggatag 
aatgtgatgc 
gtgggtctcc 
cgcctttgcg 
caggtagttt 
gtaaactatg 
tttcatatta 
atcacactga 
cacaattget 
agaeggagtc 
cagcctctgc 
tacaggegeg 
gagatgggee 
aatctaagaa 
ccgcaattcc 
tgccgacgtg 
ggggccgcac 
ggagaaaaac 
gagaggacag 
gtgctcctgg 
agctcctgag 
ccgtcgcttg 
ctgtgaatga 
ccggtgcctc 
gcccctccgc 
gtaggcttcg 
tgccagcgct 
cctgcctcgg 



taaaataaat 
atgattacat 
acataaatac 
agtggcttcc 
ttcgaggagt 
aattgtgcat 
ttttttgaga 
ctca ctgcaa 
ctgggattac 
gtttctccat 
ggcctcccaa 
taaaagaggg 
ctctgtcgcc 
caggttcaag 
ccaccacagg 
gttagecagg 
gttctgggat 
ggtctagcat 
ttgeaatage 
ctggtgctgt 
cttgagccca 
aagtaaaaaa 
ggaaggctga 
ggtgaaaccc 
tgatcccagc 
tgcagtgagt 
gtccaaaaaa 
tctcatgggg 
ttccttagtt 
agagaaaaaa 
agggggaaag 
attacataac 
attgataaac 
agecaagatt 
gtctgggttc 
cccaaaggaa 
ggatggtaac 
gacatctaaa 
gctaacattt 
ttcctctcaa 
tcgctctgtc 
ctcccgagtt 
cgcccccacg 
aattatcctt 
aacgacgaca 
cccttccgtg 
agecgaactg 
aegegtacag 
aegggaagae 
cgacaggaag 
ccgaggaagg 
accggcgggc 
gttcccgtcg 
attctceggg 
ccaggcctcc 
ccgagtcgcc 
cgctgctgcg 
tctcccgcgc 
cctcggcccc 



gaaattttaa 
ttccataaag 
actgeaaact 
tctagaggaa 
tggttacatt 
ttaagtaaca 
tggagtttcg 
cctccacttc 
aggcatgege 
gttggtcagg 
agtgttggga 
catttcatta 
caggctgeag 
tgattctcct 
aatgcacctg 
ctgctcttga 
tacaggegtg 
aagcacagag 
ctgtgacatt 
ggctcatgcc 
ggaattcaag 
attagctggg 
ggcaggcgga 
tggctctata 
tactegggag 
catgttgttt 
taaaaaaata 
catttggaaa 
ttaggaaaca 
gacgtggaga 
gagagaggaa 
caagtgacca 
ccgctcttaa 
ccaggtccca 
tgtgcttgca 
gggatgctga 
tatgeaaaac 
tatgeactaa 
ttgttgctgt 
ataattccca 
gcccaggctg 
caagegatte 
cccggctaat 
eggagaagae 
ctgagagagg 
gatcgattac 
cacattggga 
gggccccggt 
gtgcgcgtgc 
ggaggggece 
agaaaggggc 
acaegggggt 
gtctgcggga 
tggacgaggg 
gcccccttgc 
geataagegg 
tttggtcgcc 
cctcatggca 
ggcgccggtg 
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ccgggcggcg 
attgccctgc 
ggcgccggga 
cgggagggga 
cggagcctca 
actttgtttc 
acccagacgt 
jactgtgaag 
^aagcagtgc 
lacaaatgg 
tttaatca 
;rttag 
. -ctt 

3C 



■jCt. 

caaaag 
• • jcatttta 
gctaataat 
caattctccc 
aaacacccac 
aacagaaaca 
ttctagaatt 
ggatataagg 
agagaggtca 
ttgttaactg 
cagactggag 
cgattctctt 
gctaattttt 
aactcctgac 
cagccactgt 
cccttgggga 
gatcattttt 
ggggcgggtg 
catctctact 
tactcaggag 
cgagatcgtg 
aaagtaggtc 
ggctgaggtg 
aaaccctgtc 
cccagctact 
atgagctgag 
aaaaaaaaaa 
aaagtcagaa 
cagttgccca 
gattcaagcg 
cacgcccagc 
ggtttcgagc 
acaggtgtga 
ggagttggga 
accctgagct 
agaattcaga 
tatatctatt 
atataaaaat 



aggccgagcg 
gcatcgatga 
agaaggcggt 
cggtgcaccc 
tcttctagta 
agacaccagc 
gttgatgaca 
agtgtgcagc 
cgccttactg 
tgacaatttt 
agataatcat 
cataaaa ._t 
taatttccaa 
agtaaaacct 
ggtttctttt 
--"jagtgca 
*. : . ^ctgcct 
at.ttttgtat 
..cgacctcgt 
ccgcgcctgg 
ttgcatgtgt 
tgttatttaa 
gagatgaaga 
gaaatttctt 
cttttatcct 
ttttctacca 
atctgcactt 
tcaatcttgt 
aaagaggcag 
aggagggtgt 
ctccattctt 
tgcagtggcg 
gcctcagtct 
tgtattttta 
ctcaggtgat 
gcccacccag 
gaattaaaac 
tgggccagtc 
gatcatgagg 
aaaaatacaa 
gctgaggcaa 
ccactacact 
atttttggct 
ggtggattgc 
tttgtgaaaa 
tggggggctg 
atcgtgcaac 
aaaaaaacca 
catgcaagga 
ggctggagtg 
attctcctgc 
taatttttgt 
tcctgacctc 
gccgcggtga 
ggtaggataa 
cttagatttg 
cctcaggtct 
atacttaaat 
aattatttaa 



cgtccgagtc 
ggatgagaaa 
ggggtcgccg 
ccggaattga 
ttcttaaaac 
cttcccccac 
gtgacatttg 
ttcctctgaa 
gcttttaatg 
gaaagaaata 
tttatcagta 
ttccccctgt 
gttgaaatgt 
aaaacaacta 
aagctaactt 
atggtgcagt 
cagcctcccg 
ttttagtaga 
gatcgggtcg 
ccttaagcta 
tatctttttt 
tcctcacaat 
aaatgaggcc 
ttatggaaaa 
tacttccagt 
cacctcaatt 
cattcatagt 
tgaaacctgt 
ttattcattg 
taacatttaa 
tttttttttt 
tgatctcagc 
cccgagtagc 
gtagagatgg 
tcgcctgcct 
caagctccat 
ggttgcaaag 
atggtggctc 
tcaagagttt 
aaattagctg 
gagaagtgct 
ccagcctggg 
gggcacggtg 
ttgagcccag 
atacaaagat 
aggtaggagg 
tgcactccga 
aaaaaaaaaa 
aatttttttt 
caatggtatg 
ctcagcctcc 
gtttttagta 
aagtgaaccg 
ccgaccacaa 
aaggagaaat 
aagaaatagc 
caggctggtg 
cctcctaaac 
tttattttag 
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ttccacaaac 
ggtaactagg 
ggggagggca 
tatgccccgg 
ctctcccctt 
acttctgcat 
tcctagagtg 
ccaaggtttc 
aaagcagagt 
gctgcatatg 
caacgattcc 
tgctttgatt 
ttgatgaatg 
tgtatgtttc 
tttttttttt 
ctcggctcac 
agtagctggg 
gtagggattt 
cctcggcctc 
acatttttta 
ctttttaaaa 
aactttgtga 
caaaagataa 
taagtgaaat 
atgctgagat 
agatactcac 
gtctgtctct 
ttcctttgtg 
ttttggacag 
gaatactatg 
ttttttgaga 
ttactgcaac 
tggaaccaca 
tgtttcacca 
cgaccttcca 
tctttatcac 
ttttagaata 
acgcgtgtaa 
gagaccatcc 
ggcatggtga 
tgaacctgga 
cggcagagca 
gctcatgcct 
gagtttgaga 
tagctaggcg 
atcacttgag 
actgggtgac 
aactgtttta 
atttgtttat 
atcttggctc 
tgagcagctg 
gagatggggt 
ccctccttgg 
ggaaatttta 
taaggaaaac 
agttccatgt 
acttaaatct 
atttttattt 
agacagtgtt 



aggccttcga 

gggctggggg 

acacctgcgt 

gagactgctt 

tcagggcact 

gacccaggtc 

accacactga 

caaaaggttt 

attgtagtgt 

actgcagttg 

tgaatacttt 

ttaattaaaa 

gattgcgtaa 

tgaatgaaag 

ttgagacgga 

tgcaacctcc 

attacaggca 

caccatgttg 

ccaaagtgct 

ttatatgtgc 

aaaatagcaa 

gatgaaggta 

aggaggttat 

taggagaagt 

cttgcttctc 

ttgcattgtc 

actgccaact 

gggcctggga 

taaggaaaga 

tgtttgtaga 

tggagtctcc 

ctctgcctcc 

ggtgcgccct 

tgttggccag 

agtgcttgga 

ctcttaagaa 

gaggaacatg 

tcccaacact 

tggccaacat 

cacatgcctg 

aggtggaggt 

agactccgtc 

gtaattccag 

ccagcctggg 

cagtggcaaa 

ctcaggttgt 

aggagtaaaa 

attgttttat 

ttttgagacg 

actgcaacct 

ggattacagg 

tccaccatgt 

cctcccaaag 

gttaacactg 

ctaggcatga 

gaggaataag 

ttcagtatca 

ttcagttgga 

tcactctctt 



gtacatctcc 

agggggcggc 

cccttttctg 

tcccgtaggt 

gtagctgtcg 

actatgagac 

tcctttctag 

tgatattgaa 

cagaaaaaaa 

aatttgcatc 

ttcaatgaag 

cagtattcca 

acttaaacat 

caaggatact 

atctcgccct 

gactccctgg 

cgcaccacca 

gccaggatgg 

ggtaatacag 

caggcattgt 

ccatcccaga 

ttattggtat 

tccaaacctg 

ctaactttta 

cctctgccaa 

cattagtgaa 

ccaaaaactg 

gtgggaagtg 

gtgacggtta 

aggaaatttt 

ctgtgtcacc 

cagacgcagg 

atcacggctg 

actggtcacg 

ttacaggtgt 

catccaggat 

tttaagcgta 

ttgggaggcc 

ggtgaaatcc 

tagtcccagc 

tgcagtgagc 

ttgaaaaaaa 

cactttggga 

caacatagtg 

tgcctgtagt 

tcaggctgca 

ctgtctcaaa 

ttaggaagag 

gagtctcgct 

ctgcctcccg 

tgtatgccac 

tggccaggct 

tgctgggatt 

ttggttgatg 

aaaataaaag 

tggaagaaat 

catatatgaa 

tatattaaat 

acccaagctg 
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gagtggaatg 
ctcttttttt 
tcaacaatat 
ttaagtttac 
tctgttcaca 
tgagacagag 
gctagctccg 
ctacaggcgc 
cactgtgtta 
ccaaagtgct 
gtggacatca 
tcttcaccca 
ggttcaagcg 
cccacaccca 
ctgttctcga 
ttacaggtgt 
aactgatgcc 
tcattttcct 
cccagctact 
gtgagctgag 
aaaaaaaaaa 
tcccagcact 
cctggccaac 
agtggtgcac 
tccagaggtg 
gagcaagact 
ttcttatcta 
tccagtggtt 
aaaccttagt 
atcaaataga 
ctatcaagga 
tttttttttt 
gcgagatctc 
cctcccaagt 
tttttagtag 
tgatccgccc 
gcctacttat 
aactgtagta 
ctcattttaa 
tttattctta 
tgctctgtca 
cccgggttca 
ccactatgcc 
caggctgatc 
gggattacag 
taaaggcctt 
tgttgactta 
cagttaattt 
gagatgtgtt 
catacacatt 
cttagctcat 
agtagctggg 
gatggtgatc 
aagactgaaa 
ctcatagcag 
tttatactgc 
aaaagagaag 
gctcctgtgg 
gtgacgtttg 



tgatcatagc 
tttttttgct 
tttgaacaat 
gccattctcc 
actttttctt 
cctcgctttg 
cctcccgggt 
ccgccaccat 
gccaggatgg 
gggattacag 
gaatgggctg 
ggctggagtg 
attctcctgc 
gccaattttt 
actcctggcc 
gagccaccgt 
gtaatatgcc 
ttaaaaatga 
cgggagggtg 
atctcaccca 
aaaggctggg 
ttgggaggca 
atattagtga 
gcctgtagtc 
gagattgcgg 
ccatctctca 
tcttaaattt 
gaaagagagt 
tccaagagaa 
aacgagttga 
gctggtaata 
ttcttttttg 
agctcgctgc 
agctgggact 
agacggggtt 
accttggcct 
cttctaattt 
gtgttaattg 
tgaaatctcg 
tggcatacta 
cccacgctgg 
agcgattctc 
tggctaatat 
tcgaactcct 
gtatgaccca 
aatttatctg 
atgagaggat 
gtacagctct 
aaaacattag 
ttgagacagg 
tgaagcttca 
tctacagaca 
ttgccctgtt 
acctgtgata 
aaacaaaaat 
aggtttttat 
gttgtaataa 
gtagacaagc 
atttctcaag 



tcactgcagc 

agagatagga 

aaaaaaaaaa 

tgcgtaatgc 

tatattttga 

tcgcccaggc 

tcacgccatt 

gcccagctaa 

tctcgatctc 

gcgtgagcca 

ttgacagctc 

caatggcgcg 

ctcagcctcc 

gtatttttag 

tcaagtgatc 

gcccagcctt 

aaattaaatt 

agtaaaactt 

aggcaggaga 

ttgcactcct 

catggtggct 

gaggcaggcg 

aaccccgtct 

ccgggtactt 

tgggccaaga 

aaaaaaaaaa 

tttctttagg 

gcacttttga 

tgtaattctt 

ataggcagtc 

tcatgcactg 

agacagagtc 

aagccccgcc 

acaggcgcct 

tcaccgtgtt 

cccaaagtgt 

aactgaaaac 

aaatatttgg 

tgtaaatgtg 

aaaaaaaaaa 

agtgcagtgg 

ctgcctcagt 

ttttgtattt 

gacctgaagt 

ctgcacccaa 

aaaccaaact 

atgtgaagtc 

gcattttaga 

ttatgtgatt 

gccttggtct 

gcctcgcagg . 

tataccacca 

gactaagttg 

gccattttat 

agaatttaag 

gttgtaatgc 

tggttctttg 

cggaaatctc 

tacataggac 



ctcaaggctc 
tcttgttatg 
taaattaggt 
atatttcata 
tttcttttct 
tagagtgcag 
ctcctgcctc 
ttttttgtat 
ctgacctcgt 
ccgcgcccgg 
tttttttttt 
atctcagctc 
ccagtaactg 
tagagacagc 
cactcgcctt 
gacaggtctt 
agttcagact 
tagccggatg 
atcgcttgaa 
gcctgggtga 
caagccgggt 
gatcacttgt 
ctactaaaaa 
gggacgctga 
tcacgccact 
aaaaagaaaa 
agattgaata 
agtctgcctc 
cctctttctc 
tcttcaaagg 
ccattccctt 
ttgctctgtc 
tcccacgttc 
gccatcacac 
agccagtacg 
tgggattaca 
caatttattt 
taccttgaaa 
ttttatatgg 
aaattttttt 
cgcaatctcg 
ctcccgagta 
ttaggagaga 
gatccgcctg 
cccatactca 
atttcaaaag 
tatttattaa 
tatttgagaa 
aacaaatatg 
gttgttcagg 
ctcaatcgat 
tgcttggctg 
gtaaatattt 
ataaggagaa 
tgaatggact 
tggtaatgag 
gatttactag 
ctgggtaaca 
taaacagaaa 



attcctaggc 
ttagccaggc 
tttattgtaa 
ctcttcctac 
cttttctttt 
tggcgcgatc 
agcttcccga 
ttttagtaga 
gatccacccg 
cacatatttt 
ttttgaggca 
actgcaacct 
ggattacagg 
atttcaccat 
ggcctcacaa 
tagtttgatt 
gaaacggatt 
tggtggcggg 
cccaggaggt 
gaagagtgag 
gcagtggccc 
agtcagaagt 
tacaaaaatt 
cgcaggacaa 
gcacgccagc 
ctgagtttat 
tttttgtact 
ttggctgtcc 
agtgcttcaa 
tttcctaact 
ggcaacatga 
acccaggctg 
acgccatttt 
ctggctaatt 
gtctcgatct 
ggtgtgagcc 
gattcagtga 
tgttaaatgc 
tgactatgtt 
ttttttttgt 
gttcactgta 
gctggtacta 
cagggtttca 
cctcagcctc 
aatttgacac 
aggaatagca 
agcaaatatt 
atatttattt 
tgtacatacg 
ctggagtgca 
ccacccacct 
attttttaat 
taattgttga 
gctgaagttc 
caaaatattg 
ctccttggaa 
aacatatcat 
caatggtgga 
aggcctagta 



ttaagtgatc 
tggagaaatt 
agtggtatgt 
tgataatgtt 
tttttttttt 
tcggctcact 
gtagctggga 
gacggggttt 
cctcggcctc 
gatttctaat 
gagtctcgct 
ccacctccca 
catgtgccac 
gttggccagg 
actgctagga 
ttagttcaac 
acttaaagat 
tgtgtgtaat 
ggaggttgca 
actccatcaa 
atgcctgtta 
tcgcgaccag 
agctgggcat 
ttgcttgaac 
ctgggcaaca 
attgttatgg 
ttagtcttaa 
ttgacaacac 
aatatatatg 
ctgtggttaa 
cttatctttt 
gagtgcagtg 
cctgcctcag 
ttttttgtat 
cctgtcctcg 
actgcgcctg 
aatggcatca 
caaattaaat 
tattctgaat 
aatggagtct 
acctccacct 
caggcgtgca 
ccatgttggt 
ccaaagtgct 
tgaattttca 
cagcaaattc 
aattggaggc 
cctctccagt 
tatatatgta 
atgacaccat 
cagcctccct 
tttttgtaga 
actttcttgg 
aaagagtaga 
tactttttac 
tatttggagg 
gttctgcatg 
ggttctctag 
tgttatatga 



13980 

14040 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14620 

14880 

14940 

15000 

15060 

15120 

15180 

15240 

15300 

15360 

15420 

15480 

15540 

15600 

15660 

15720 

15780 

15840 

15900 

15960 

16020 

16080 

16140 

16200 

16260 

16320 

16380 

16440 

16500 

16560 

16620 

16680 

16740 

16800 

16860 

16920 

16980 

17040 

17100 

17160 

17220 

17280 

17340 

17400 

17460 
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atgagagatc aagtttctca ggatattcta gggctaaagg atcaggcatc gaagacagaa 17520 

attgtctaaa taaaattttt tctattcata gttttaaagg gctaaagggt caggcattga 17580 

agacagaaat tgtctaagta aaatattttt ctgttcatag ttttaagctg tgtatatgtg 17640 

catgtgtgta tttaaaataa cttcgtcaat gaaaagagtc aaactctgta aaatatttga- 17700 

agagatttat tctgagccaa atatgagtga ccagtggccc atgacacagc cccagtagat 17760 

actaagaaca tctgtccaag gtggtcaggc tatagcttga ttttatacac tttagggaga 17820 

cataagacgt cagttaaaca tgtaagatgt acattggttc catctggaaa ggcaggaaaa 17880 

ctagaagttg gggaggcttc caggtcgtag gcagattcaa agattttctg attggcaatt 17940 

ggtcaaaaga gcttatctaa agtcctggaa tccatagaag ggagtgtctg gtttaaaata 18000 

ataggttgta gctaccaagg tttttattgt acagatgaag cctccaggta gcaggcttca 18060 

gagagaatac attgtaaatg tttcttatga gactttaaaa ggzggcagac tcttaagtta 18120 

attttctcct ggttcaggta aaagacttgg aaagggaaag gattctctac agaacgtaaa 18180 

ttttccccac aagagaaagc tttgcagggc catttcagaa tatgtcaaag aaatataatt 18240 

tagggtaaaa tacttcaatt tgttttattt atttatttat tttttgagac agagtctcgc 18300 

tctgttgccc aggctggagt gcagtggcat gatctcggct cactgcaagc tccgcctcct 18360 

gtgttcacgc cgttctcctg cctcagcctc ctgagtagct gggactacag gcgctggcca 18420 

ccatgcccag ctattttttt tgtattttta gtagagacgg gatttcacca tgttggccag 18480 

gatggtctcg atctcttgac ctcgtgattc acccgcctcg gcctcccaaa gtgctgggat 18540 

tacaggcgtg agccactgtg cccggcctca aaatacttca atttctttca tggcctgcta 18600 

tctgacgtga tgctgtacta gagtcaggct gggaatttgg cgtcttattg ctacaaaaca 18660 

tcttaatatc tctgttttaa tgttaatgct gatcagttgt ccctgaattc caaagggaag 18720 

agggtatatg agtcatgtcc aacccccact tctcattatg gcctgaacta gttttttagg 18780 

ttaactttgg aatgcctttg gcaaggggag ggtccatgag tcagttgggg gtcttagagt 18840 

tttatttttt gcttaccggt ttataaaaag ttaatgaaaa ttatcatatt tcataattct 18900 

atataattca atattgtact ttatttaaaa ctcacgtata aaatagctgt ccatatctgt 18960 

tttcagaaga tgaggatgga gggtagaaat cagaagtgtc agatttggta attttcttac 19020 

actgctgaaa acctatacct accactttga aaggattaat ttcagacttg ctttctttgg 19080 

gcctaatgat tctactttga agtttctctg attaaactaa ggaataaatc tgataaatgg 19140 

acattcagat gataccatac ttttccaaaa gataacattg cttttgatta catatgcaat 19200 

aaacatttca cattttttct caagattatt tactggcatc tgoaccaaag acacaaaaaa 19260 

gcagccactg ttaaggactt tatcccttgt tctgttttta gctggtttgt tgttgtattt 19320 

ttcctcatgt tgaatacagt taaaccctat taaactggat tccccatatt actgttagtt 19380 

gtcctgatga caattaagga tagttagtaa atggatattg aatcatttta tttttttagt 19440 

agtgatggcg tttcgctgtg ttggccaggt ' tggtctcgaa ctcctggcct caagtgatct 19500 

gcctgtgttg gcccctcaaa gtgttaggat tacaggcgtg agccactgca cctggctgga 19560 

tattgaatta ttgaagaagg atgttcccta acacttcctg cctcttttcc gctgtcttac 19620 

tctctctgtt ccacccagta gtagttgggt ttttgatgtc tggcaaagta tagattgtct 19680 

actcttctat attagttttc ttcactcttt tttttaaaaa tgtttttaaa gcaagataga 19740 

gacagggtct tgccgtattg cccaggctgg tcttgaactc ctgagctcaa gcaatcctcc 19800 

cacctcaccc cataaagtgc ggagattaca ggcatgagcc accatgcctg gccagttttc 19860 

ttcactcttg acctataata gtcctgcaaa gccagtgaag ctgttaatat gctgacgtag 19920 

cctttttttc tctcgtttgt gaattattaa caatcgctga tcttacacat catatacaat 19980 

aaaacatctt tgaacactgt cacatctcag cagctcattc tggttaatga ggaaagaaaa 20040 

atgtcaaaat ctgtgatttt cttagaggtt attaaatgtt ttacagctat gtagatattc 20100 

tgtagacttg ctgtacttac ttacataact tttctgctct tctgcagagg gagagaatta 20160 

acttcataag tgggctttgt caatgccctc cagtcagcga tctccaggaa caaacttatc 20220 

tatggttgag caagtggggt ttattaccca ctgtagccag ggagaacaca catatgtaat 20280 

aaccatggta tgtcatagta aagggtgtta ggaagatagg atttgggctc gtttatttgg 20340 

tgattttaag gagggtttaa agaagcaggg ttttgctctg atttggatgc taccaggagc 20400 

tgcgaataat tctatgaata aatatcataa aacctatcta gaagaaaaga ctagagtgag 20460 

gtctaaagct gtagtagtta aaaagcaaag gtcactcctt atctggaaaa ggggaatatt 20520 

tggtatttca tggtttagac agtgttcagt gttcatgttt tgcctgtgtt tagacataat 20580 

tgtagagtgg tcttgttcca ccgtggtcac agagtggcat tatttcatgc tgatattctg 20640 

taagtgccag gtcaaatacc aaggtttagc tgatagtagt aggccagctc ctggatgtaa 20700 

taagctgttt ttctctttct cagctttttt ttttgttgtt ttttttttaa aatagagtct 20760 

ggctctgtca cccaggctgg agttcagtgg gggcaatctc agctcactgc agcctctgcc 20820 

tcctggattc aagcgactct cctgcctcag cctcccaact agctggaatt acaggcgcaa 20880 

gtcaccacac ccggctaatt tttgtatttt tagtagagac ggggtttcac catgttgagc 20940 

aggctggtct cgaactccgg acctcaagca atccatctgc ctcagcctcc caaagtgctg 21000 
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agattacagg catgagtcac tgcacctggc ctgtttctta gatttgaggg tcaactttta 21060 

cccttttcga actgtggggc ttcttatgga aattgacatt taagtcctga ccatatagga 21120 

tcttgggcaa gttacttaac tatgtatgct gagatgtttt tttaaatgct tagtgcttgc 21180 

acataatagg tactcagtaa atgagaacta ttattataaa atcaatagta cttttaagat 21240 

tacagctaga ggttatgtta gaacattgtt aactcttcgt actagtttct gttacacttt 21300 

ttaggatgca gtagcagcat aaacgagata tggggaagaa cgagaggtat ttaaacagtg 21360 

atataggccg ggcgtggtgg ctcacgcttg taatcccagc actttgggag gctgaggtgg 21420 

gcagattacg aggtcaggag attgagacca tcctggctaa cacggtgaaa ccccatctct 21480 

actaaaaata caaaaacaaa attagccggg cgtggtagtg ggcgcctgta atcccagcta 21540 

tttgggaggc tgaggcagga gagtggcgag aacccaggag acagagcttg cagtgagccg 21600 

agatcgcgcc actgcacccc agcctgggcc acagagcgag actctgtctc aaaaaaaaaa 21660 

aaaaaaaaaa attaaaacaa aaatatttgt gttaattgtg atgacaaaaa aaaaaaaaga 21720 

gatggaagtc tctccctaac ctcactcctc atttagtgtc atggcttttt tctttttttt 21780 

tttttttttt ttgagacaaa gcctcactct gtcacccagg ctggactgca gtggtgcaat 21840 

ctcagctcac tgcaggctct gcctcccaga ttcaagcaat tctcctgcct cagcctcaca 21900 

agtagatggg actacaggca catggcacca tgcccagcta attttttgtg tagtttttag 21960 

tagagacagg gtttcactat gttggccagg ctggtctcga actcctgagc tcaagtgatc 22020 

ccccctcctt ggcctcccaa agtgctggga ttacaggcgt gagccctgct cccagactcc 22080 

tggctttttt tttttttttt aatgaaaaat tcaaaatgct cttttttttt tttttttttt 22140 

tttgagacag agtctcgctc tgtcgcccag gctgaagtgc agtggtgtga tctcggctca 22200 

ctgcaacctc tgcctcccag gttgaagtga ttctcctgcc tcagcctctc gaacagctga 22260 

gattacaggt acgcgccacc acgcctggct aatttttgta tttttaatag agatggggtt 22320 

ttgtcatgtt gtccaggcta gccttgaact cctcgcctcg tgzgatccac ctgccttggc 22380 

ctcccaaagt gctaggatta taggcgtgag tcgctgcacc tggccacaga aattttttga 22440 

agaagataaa taaggtgaca tttttaaggg tcaaagaaaa tgtcaaaaac tagaatgatg 22500 

tctttacata gggtttaaaa ctttccaaat taacagggaa aataattctt taccttgaaa 22560 

ataaatgttt gctagtgaaa gcaaatacaa tctttttact aaatgtttta ttaaattttt 22620 

ttttcttgta gacacagggt cctactgtat tacccaggct ggtcttgaat gcctggcctc 22680 

aagcaatcct cctacctcag tcttccaaag tgctgggact acagacatga gccatcacac 22740 

tgggtctttt ttaccaaatt atagtagaaa gcactttttc tctaatggtg aactatgaga 22800 

gaattaatca ggggctatta gtaattcatc cctgaattaa tcagtgatta taatgctttg 22860 

tggtccatgt agtttgctgg ggattaacac accatgaaag tctaccagga gatttttttt 22920 

tttctttgag aacaggggcc ataatcagta gtccttaaat gaaatggact attcccattt 22980 

cattatatgt tgcctaggct ggactcgagc tccttggctt aagtgatctt cccacttcag 23040 

actctcaagc agctgggact ataggtgtgt gccaccatac ctggcttaat tgagtgtttg 23100 

ttttttgttt ttttttctga gacagagtct cgttgtgtcg cccaggctag agtgcagtgg 23160 

cacaatctcg gctcactgca acctctgttt cccaggttca aacgattctc ctgcctcagc 23220 

ctcccaagta gctgggatta caggcgcctg ccaccatgcc tggctaattt ttgtattttt 23280 

agtagagatg gggtttcacc atcttggcca ggctgatctc gaactcttga cctcatgatc 23340 

cacacacctt ggcctcccaa agtgctggga ttataggcgt gagccaccgc gcccggcttt 23400 

aattgagatt tttagatatc tattactctg ctaattttgt cacttgcaag ttgccatcag 23460 

aaaattgtag gaaaatggat atatttgttc cttggaatgg tt':gtgtgag aatacttaag 23520 

gattaaatag ataagtaaaa ctggtgggct ttatataaca tagatgagca aatgtcagga 23580 

acatacaact gtgcacacag ttcaggagaa ggaggattta agttaatcaa caaatttact 23640 

aagtataata aagatactaa aagtagtgtt tccataccac tttattactt aaagtatcat 23700 

catataccct attttatatg atttttgcca caagtcagag ttaggtaaaa gaaatacttg 23760 

cttttcaggt aaggagtttg acgcccagac agattaactg acttttccaa aatcatattg 23820 

ctattaaatg gtggaacaag gacttaaatc tttgccttct aactcacata cttgcaaaca 23880 

catatcctct cactctaccc caagctaccc atgttttgac ccttcttgtg gcaatctggg 23940 

tctcactaat atttgaaaga aaacgtacag tagataattt gcaagttaat ctgttacgca 24000 

tatctcttac ctctatttaa agatgaatat cagcatttct gttgtttcta cagtaacata 24 060 

ctaaaaaata atgcagtcca ggtgcagtgg ctcacacgtg taatcctagc acttttggaa 24120 

gttgaggcag gaggatcact tgaagccagg agttcgagac tagcctgggt atgcaagacc 24180 

ccatttctgt tttttttttt tgtttgtttt gttttgtttt gttttgtttt tttgagacgg 24240 

agtctcgctc tgtcgcccag gctggagtgc agtggcggga tctcggctca ctgcaagctc 24300 

cgcctcccgg gttcacgcca ttctcctgcc tcagcctccc aagtagctgg gactacaggc 24360 

gcccgccact acgcccggct aattttttgt atttttagta gagacggggt ttcaccgttt 24420 

tagccgggat ggtctcgatc tcctgacctc gtgatcccca tttctttttc actgcaacct 24480 

ttgcctccca ggttcaagtg attgtcgtgc ctcagcctcc caagtagctt gggattacag 24540 
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gcatgtgcca ccatgcctgg ctaatttttg tattttttgg tagagatgga gtttctggcc 24600 

aagctggcca ggctggtctc gaacgcctag cctcaagtga tctaccctcc ttagcctccc 24660 

aaagtgctgg gattacaggt gtgagccact gtgcccggcc ccatttctac aacaattaaa 24720 

aaatattagc ccagtgtagt ggtgcatgtc tctagtccca gctactcaga aggctgaagt 24780 

gaaaggattg cttgagccca gaatttcaag gctacagtga gctatgataa tggcattgca 24840 

ctccagcttg ggtgacagag tgagaccctg tctctaaaaa atgaagtaaa atagtgcaca 24900 

agtatagaac ttgaaaatct tccttaacct taccataagg gaaatgatta ctaataagtt 24960 

tcttaacttt ttgtacttac ataaacataa atattcatca gagaaaaaaa tatgcaaaac 25020 

aatttgcaat ctttttcact taccatattt tggaattttt ttcatttcaa tatatttgat 25080 

cttccttgtg ttttttcagt ttgtttgttt ttgtcaccca ggttggagtg aagtggtaag 25140 

aacatggctt attgcagcct caatctcctg ctcccattca gcccctcaag tagctgggac 25200 

tacaggtaca tgtcaccacg cccggctaat ttttattttt attttggtag agatggggtt 25260 

tcaccatgtt gcccaggctg atcttgaatt cctgggctca agtgacccgc ccacctcagc 25320 

ctcccgaagt gttgagagaa caggtgtgaa ccaccatgct ccacctctta gtctttacaa 25380 

tctgcaaaac ctcataagtg gctaatagag gaatatagta aagcaaaggg ggatatcact 25440 

gattagaact gtgtttttag gctgggtgcg gtggctcacg cctgtaatcg caacattttg 25500 

ggaggctaag tgggagtatc acttgagccc gggagttcaa gaccagcctg ggcaatatag 25560 

tgagagaccc tgtctttaga aaaaaattaa ccaggtgtgg tggtgcacac ctgtggtccc 25620 

agctattcaa gaggctgagg tgggagaatc gcttaagcct aggaggcgga ggttgcagtg 25680 

agatcatacc actgctctct agcatgggtg acagagcgag acccagtcta aaaaaaaaag 25740 

tattttttcg tttttttcca actcatgtac acccgccacc ccacccctgc tttttttttt 25800 

tctgacattg ggtcttgctc tgtcacccag gctagagtgc agtagcacaa tcaactcact 25860 

gcagcctcct cttcctggac tcaagcagtc ctaccacctc agcctcccaa gtagctggga 25920 

ccacaggtgt gcaccatcat gcctggctaa tttttgtact ttttgtagag atagggtttc 25980 

accatgtggt tcaccatctc taactcctgg gctcagtcag tccacttttg cctcggcatg 26040 

agccactgtg tgcagcccac gttttttatt aatggatatt tggattgttt ccatctattg 26100 

tgaataatgt ggctatgaac attggtctaa atatctgttt aagtcccggc tttcaatact 26160 

tttggatata tacctaggag tagaattact gaattatatg gtaactttct gtttaaattt 26220 

ttgaactgcc aacctgtttt ccataggggc tgcaccattt tgcattccca ccagcagtgt 26280 

acaagggttc cagtttctcc acatttgtta tttttcattt tttaaaataa tagtcatcct 26340 

aaagggtatg aagtggtatc tcgttgtgat tttgatttgc atgtattttt ctaatgactt 26400 

atgatgctca gcattttgtc atgtacttat gtaccatttg tgtatcttct ttggaaaaat 264 60 

gtctattaat gttcttttcc cattttttaa ttgggttgtt tttatgttta tcaattttgt 26520 

aaacatttta agctctgcag cataactact caaccctgtc acatggtaag attgacccag 26580 

taaaacttta tgtacaaaaa taggcagctt actagattta atcttagtcc atagtttgct 26640 

aaggcatgca ttagataatg tagttacact attggctaat aatttaaact acaagtggtt 26700 

gtaagtttct gccacccaaa ttctttcttg atttgatgta gtctggttgg ttgaatttga 26760 

gtgttatatg gggtcataga gttaaaagag aaatgtctat gagaaactag ggactgttgg 26820 

gagctaatgt taaaggattt tggaggcctt ttgtgcactg gagaccattg gaagattgga 26880 

ttttctgcta taaatgtatc taaaggataa tcagtgtaag ttatgggctg tagtttgcca 2694 0 

acccctacat taagggattg aaataatttg aatatgggtt tcagttcttg tatggtctgg 27000 

ctcagttctt tttttttttt tttttttttt tttttttttg agatggagtc tcactctgtt 27060 

gcccaagctg cagtgccatg gcacgatctc agctcgctgc aacctccgcc tcctggcttc 27120 

aagtgattct cctgcctcag cctccagagt agctaggact acaggcacgt gccaccacat 27180 

ctggctaatt tttttttttt tcaagacaga gtttcgctct tgtcacccag cctggagtgc 27240 

aatggcacga tcttggctca ccgcagcctc cgcctcctgg gttcaagtga ttctcctgcc 27300 

tcagcctccc aaatagctga ggcaacaggc gtgcgccacc acgcctagct aatttttctg 27360 

tttttagtag agatggggtt tcaccatctt ggccaggctg gtctcgaact cctgatctca 27420 

tgatccaccc gcctcagcct cccaaagtgc tgggattaca ggcgtgagcc acctcacctg 27480 

gcgttttttt gtgtgtgttt tcagtagaga tggggcttca ctgtattagc cagaatggtc 27540 

ttgatctcct gacctcgtga ttcacctgcc tcagcctccc aaagtgctgg aattataggc 27600 

atgagccacc acgcctggct gtggctcagt tcttaactgt tcattcattc agggtcccag 27660 

ccaaaatctt ttgccacagc ttctcctggg catgctctga aattcatttt ttgtctgttt 27720 

agttgcatga gtccactgaa agctttgctt attttctcca ccactttcag agttcacagt 27780 

cacttcaagt agacgaggtc aggagatcga gaccatcctg gccaacatgg tgaaaccccg 27840 

tctctactaa aaatacaaaa cttagctggg cgtggtagcg tgtgcctgta gtcccagcta 27900 

ctcaggaggc tgaggcagga aaattgcttg aacccgagag gcagaggttg cagtaagccg 27960 

agatcatacc atttcactcc agcctgggcg acagagtgag acactgtcaa aaaaaaaaaa 28020 

aaaaaaaaaa aggaaagaaa agtgctccaa atgctgggct catctctgct ggcttctctc 28080 
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ctttttatat ttcgataatt 

tcctttctaa attttggtaa 

tgtttttaaa actttttttc 

agggtctctc tcagtggtgc 

gcgattctcc tgcctcagcc 

agctaatgtt tgtattttta 

aactcctgac cccaggtgat 

tgagccaccg cacctggctc 

tgctgatgtt ataatccaag 

tgtttgttaa aaatcagatc 

tgggaggccg aggcaggtgg 

tggagaaact ccgtctctac 

tcatcccagc tacttgggag 

tccagggagc tgagatcgtg 

ctcaaaaaaa aaaaatcaga 

aatggaagca tgtagtatgt 

ttgagattta tcccttttcc 

tattccacgt gtggagatac 

tcctgttttt gttattgttg 

tggagtcttg ctctgttgcc 

ctctgcctcc ccggttcaag 

ggtgcccgcc accacaacca 

gttggccagg ctggtcttga 

gtgtgagcca ccatgcccat 

tcatgtacag gtcttagaag 

ttgactcatg tggtaaatat 

ctgggtgcca ttttgtttcc 

gtaatatttt ggtattttta 

ttgtatcttt ggattttaat 

atacgcttac ttgccaatta 

actatatata tatatatata 

atatatattt atatatacta 
atattttttt 



atgatcttgg 
tcagcttcct 
tttttagtag 
ggtgatccac 
ccagctggaa 
tgacaaacta 
cagagtcttg 
gggttcacgc 
ccatgcctgg 
caggatggtc 
gattacaggc 
gaaactgcag 
tgaaaaactg 
ggtggttcat 
tcgggagttt 
aaaattaggc 
caagaatcac 
ctccagcctg 
aaggagcatg 
gtactcattt 
actcagaata 
acaaaaatac 
aattttagtt 
tttttttttt 
tggtacaatc 
gtcccccaag 



ttttttttga 
cttaccgcaa 
gagtagctgg 
aggtggagtt 
ccgcttcagc 
taagcaatct 
tgactcaata 
ctctgtcacc 
cattctcctg 
ctaatttgtt 
tcgatctcct 
atgagccacc 
gtatgcatta 
gaaacaacct 
gcctgtaatc 
gagtccagcc 
aggtgtggtg 
ttgagcctgg 
ggcaatagag 
ggaatgggaa 
tgtttttaaa 
caagtgctat 
atgtaaacag 
aatttataac 
tgagtcaggg 
acatcttagt 
tagatgggac 



tttaaaataa 

ttttcattgt 

tagttctctc 

gacctccctt 

tcccaaatag 

gtagagattg 

ccgcctgcct 

tagttctctt 

cccaaatgga 

tgctgggcac 

atcccctgag 

taaaaataca 

gctgaggcag 

ccattgtact- 

tctgtcccta 

agccttttgt 

tacatatgtc 

cacaatttgt 

ttgttgttgt 

caggctagag 

tgattctcct 

gctaattttt 

actcttccct 

cctcctgttt 

tttgcatttt 

atgtttaatg 

taccagcaaa 

tgttcttttg 

ttgtacttcc 

tgtcttaatt 

tatttttatg 

tatatattta 

gatgaagtca 

cctcaacctc 

gactacagac 

tcgccatgtt 

ctcccaaaag 

taaaaagcag 

gtttcatttc 

caggctggcg 

cctcagcctc 

ttttgtattt 

gacctcgtga 

gcccctggcc 

ggggacaggt 

caatatctta 

ctagcacttt 

tggccaacat 

gtgcacacct 

gaaatggagg 

tgagactccg 

gaggcactaa 

attttaagcc 

tacactattt 

gtgttttctt 

aaactcttaa 

tcttgctctt 

gcaacttcta 

cacagatgtg 



taaccatcct 
tttggaaact 
tctttttttt 
actgcaacct 
ctgggagtac 
ggtttcatca 
cagccttcca 
ctaatcttac 
tattcttata 
ggtggctcaa 
atcaggagtt 
aaattagccg 
aagaattgct 
ccagcctggg 
tggttttatc 
gtctcgcttc 
agtagtttgt 
tactccattc 
ttaattaatt 
tgcagtggcg 
gcctcagcct 
gtatttttag 
ccttggtctc 
ttaaatttta 
tcttgggtaa 
tcataagaaa 
cataatgaaa 
tttttttgcc 
ctaacaacta 
ctttggcaat 
ctatatatag 
tatatactat 
tgctctgttg 
tgcctcccag 
acatgccacc 
gtccaggctg 
tgctgggatt 
tttgttgatt 
ttttttgttt 
tgcagtggct 
cggagtagct 
ttagtagaga 
tccacccgtc 
tacttttatt 
agaaaaatgt 
ataatagaaa 
tggaggctga 
ggtgaaaccc 
gtaatcccag 
ttgtagtgag 
tctcaaaaaa 
aaaaggaact 
aaatatgaca 
tctataattt 
tatggaaaac 
taatttcttt 
ttgctcaggt 
cctcttcagc 
tatccccaat 



aatgggcttg 
cactaatccc 
tttttttttt 
ctccctcctg 
aggcacccac 
. tgttggccag 
aagtgctggg 
tatagtaatc 
cattaaatgt 
tgcctgttat 
cgagaccagc 
ggcgtggtgg 
tgaacctgtg 
caacaagagc 
ttcactgcat 
tctccctttg 
ttctttttaa 
actaaatgat 
aattaatttt 
caatcacagc 
cccaagtagc 
tagagatggg 
ccaaaatgct 
tgaataaagg 
atatgtagaa 
ctaccaaact 
ggtccattac 
attcaaaatt 
atgatgtgga 
acttatattt 
agcatatata 
atatatatat 
accaggctgg 
gttcaagtga 
atgcccggct 
gtcttcaact 
acaggcatga 
tctggtgaat 
gtttgtttgt 
cactgcaagc 
gggactacag 
cagggtttca 
tcggcctccc 
tcttaagcat 
tacagcattg 
aaatggttga 
ggcgggcgga 
cgtctctact 
ctacttggga 
ccyagatcat 
aaaaaaaaaa 
tcttttgtat 
ttgttatcac 
tccctttttc 
aggaaggtga 
ttcttcttct 
tagagtgcaa 
tcaagtgacc 
catggttaat 



atatggtccc 

ttcaaacaga 

tttttgagac 

ggttcaagca 

ccccacgccc 

gctggtctcg 

attacagcca 

aaaattttag 

tggaatatca 

cccagcactt 

ctgaccaaca 

cacgtgcctt 

aggcggaggt 

gaaattccat 

gtcatatata 

cataatattt 

tgctgaatag 

ttgggttgtt 

ttttttgaga 

tcactgcaac 

tgtgattaca 

atttcaccat 

gggattacag 

tactgtaaat 

gaagagattg 

gtttttccaa 

cctttgtctc 

gggtgcattg 

gcatcttttt 

gactctgcct 

tttttatact 

atatatatat 

atgcagtggc 

ttctcctgcc 

aatttttgta 

cctgacctca 

cccaccgtgc 

agagaaaatg 

ttttttgaga 

tctgcttcct 

gcgcccgcca 

ctgtgttagc 

aaagtgctgg 

atatcttaaa 

tttgaaatgt 

ggctggctgt 

tcacctgagg 

aaaaatacaa 

ggctgaggca 

gcctactgca 

aaaaaaaggg 

ctgttacatt 

ttttgttgcc 

aaactaaaaa 

gcatccaaat 

tctttttttt 

tggtacaatc 

tctctcctca 

ttttaaattt 



26140 

28200 

28260 

28320 

28380 

28440 

28500 

28560 

28620 

28680 

28740 

28800 

26860 

28920 

28980 

29040 

29100 

29160 

29220 

29280 

29340 

29400 

29460 

29520 

29580 

29640 

29700 

29760 

29820 

29880 

29940 

30000 

30060 

30120 

30180 

30240 

30300 

30360 

30420 

30480 

30540 

30600 

30660 

30720 

30780 

30840 

30900 

30960 

31020 

31080 

31140 

31200 

31260 

31320 

31380 

31440 

31500 

31560 

31620 
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tttggtagag 
cagtcctcct 
agtcttcata 
accagccgta 
gatgaatatg 
agtcataagg 
tggccaggtg 
gaggatcaca 
tctactaaaa 
cgggaggctg 
atcgtgccac 
aataaataaa 
gaaatttcaa 
gaggccaggt 
gattacttga 
caaaagaaat 
cgggaggcca 
taggattgtg 
aaaatgaggc 
gggtggatca 
cttaaattac 
aggctgagac 
caeca ctgea 
aagtctaaga 
aaattaattt 
tactttttga 
atgttttaaa 
tgtaatctca 
agaggaggta 
tttttgtttc 
attcctaaat 
gggctgataa 
tccccataat 
taatgtttct 
tttgeaatat 
ggacagaagg 
atagctgtta 
tgatatattc 
tctttctttt 
tacccaggct 
caagtgatcc 
cttagctaat 
cgctcttttg 
cccggattca 
catgccaccg 
gecaggctgg 
gtgggagtac 
gtagagacag 
cctcctgcct 
gattgtattt 
cagcactttg 
gatcaacatg 
cgcacctgta 
gcggaggttg 
aactctgtct 
tattatacca 
acttagaatt 
tataacaaca 
tgttgtgact 



ataaaatctc 
gccttggcct 
aacttttctt 
gtatataata 
gttagttatt 
agaeggcatt 
cggtggctcg 
acaaggtcag 
atacaaaaat 
aggcaggaga 
tgcactgcag 
taaatagact 
ataataataa 
gtggtcactc 
gectaggagt 
acacaaaaat 
agggaagagg 
cccctgcact 
egggegeggt 
cctgagttca 
aaagattagc- 
agcagaatcg 
ctccagccta 
agttaatttt 
tcaaatatgt 
ttatgetgag 
ctagttgttg 
tacagcagtt 
cccagcaatg 
attgttattg 
aaaatgtctt 
gcaaaatagg 
ggagttacat 
cagacttgtt 
ttagtgtact 
agcaagctgt 
tagttacagg 
acatgattgt 
cttttctttt 
ggagtgcagt 
tcctgcctct 
tattattatt 
cccaggctgt 
ggctatttat 
tgcccagcta 
tttcgaactc 
aggcatgagc 
ggtctcactg 
cagctttcca 
atcttaataa 
ggaggecgag 
gagaaaccct 
attgeagcta 
tggtaageca 
cagaaagaaa 
gtaagagtaa 
tgaattttaa 
atattaatat 
gcagcatggt 



accatgttgc 
cccaaagtgc 
tacatgtcct 
ctgataattc 
ttcagggtga 
tcttagtcac 
tgagcgcctg 
gagatcgaga 
tagctgggtg 
ategcttgaa 
cctgggctac 
tcgtctgttt 
ggaatagtat 
aggcttgtaa 
tcaagaccag 
tagctaagtg 
atggatcact 
ctagtgtggg 
ggctcacctc 
agatcagect 
tgggtgtgat 
cttgaacccg 
ggtgacagag 
cattcagaca 
gatttgagta 
tttttaggtc 
ggttcaaaga 
etcatgatge 
aacacattat 
aaatcatatt 
tctgtaatac 
actcacggcc 
atacacatta 
cacaaccctg 
cttcatacga 
ggaatggtat 
acaaggtaag 
ccagatttca 
cttttttttt 
gatgtgatca 
gcttcccatg 
attattatta 
agtgcaatgg 
tctcctgcct 
atttttgtat 
ctgatctcaa 
cactgtgggc 
tgtttctgtg 
aagttgtggg 
atgtatttgg 
gtgggcgaat 
gtctctacta 
cttgggaggc 
agatcgcgcc 
gaaaagcaaa 
aaaacaattt 
tcttattgaa 
ctgtgaccaa 
ggatagcatt 



ccaagctggg 
tgggattata 
tatcaagtac 
tataacataa 
agaaacagaa 
tttgtgtggt 
taatcccagc 
ctatcctgaa 
tggtggcacg 
ccagggagtc 
agagagagac 
catcaagagt 
ggaaattttt 
tcccagcact 
cctgggcaac 
tggtggcaca 
tgageccagg 
tgacagcaag 
tgtaatctga 
ggccaacatg 
ggtgcacacc 
ggagggggag 
caagactctg 
aatgttcaaa 
taacgatcac 
cttttaaagc 
aaatagaaat 
aatcaattgt 
atcagatttg 
tgtatttttc 
agcattttag 
ccaaaatgtt 
caatgataaa 
ttttttatgt 
tctatacaaa 
aagaaaggta 
attgtatttg 
gatctattta 
tttttttttg 
tagctcactg 
tagctgggac 
ttattattac 
tgeaatcteg 
gagactcctg 
ttttagtgaa 
gtgatctgee 
cacacttagc 
actgatctta 
attacaggca 
gccaggcaca 
cacctgggat 
aaaattcaaa 
tgaggcagga 
attgcactcc 
acagtatttc 
aattaaagta 
gaggctgttt 
attggtgcat 
agtaagttag 



cttgagctcc 
ggcgtgagca 
tttttgagca 
gaaattgacc 
gaatcgggga 
gtttataata 
actttgggag 
caacatggtg 
tgcctgtaac 
ggaggttgca 
tccatctaaa 
cattgtatta 
gtttgattaa 
tegggagace 
atggcaagac 
tgcctgtagt 
agttggaggg 
actctgttta 
gcactttgag 
gtgaaaaccc 
tgtaacccca 
gttgcaatga 
tctcaaaaaa 
aataatagaa 
tttacagaag 
ttaacttgta 
gtgttattaa 
taaataaaaa 
aatatgagat 
aaaagtatat 
gttataagga 
gataaacatc 
aatactaaga 
attacctctc 
taatttttta 
ttgaagaact 
tttatageca 
tttatttatt 
agacagggtc 
caacctcaaa 
cacaggcgca 
tagtttttga 
gctcactgca 
agtagctggg 
gatggggttt 
cacctcagcc 
taattaaaaa 
aacttctggc 
tgagccactg 
gtggctcatg 
caggagttcg 
attagecagg 
gaattgcttg 
agectgggea 
atttaattaa 
tgatatatgc 
tagttttatt 
gcatgggcaa 
cattggttgt 



tgggctcaag 
aactgtgccc 
cctactgtca 
tgtttaaggg 
ggtagtacat 
agacttcatg 
gccgaggtgg 
aaaccccgtc 
cccagctact 
gtgaaccaag 
taaataaata 
tattgatttt 
atggggacat 
agggcaggag 
cctatctcta 
cttagctact 
tgcagtgagc 
aaaaaaaaaa 
aggecaagge 
cgtctttata 
gctactccag 
gecgagattg 
aaaagaaaaa 
ataaaacaaa 
ttattctaca 
tcaggaatta 
atgccacact 
cttcctctag 
taaacaatgc 
atacttaaaa 
tcaataccat 
atgaccatat 
agttatatag 
aaaagcatga 
ttttaaagca 
ggaaaaagga 
tcccaaatta 
tatttttctt 
tttcctctgt 
cttctgggct 
cactaccata 
gacagagtct 
atctccgcct 
attacaggtg 
tgccacgttg 
tcccaaagtg 
aaattttttt 
ctcaagtgat 
tacccagcca 
cctgtaatcc 
agaccagcct 
cgtggtgtcg 
gacccaggag 
acaagagtga 
aaatgccttg 
tcttttcatc 
tagatatggt 
tgaaaagcta 
aaaatgaatc 



31680 
31740 
31800 
31860 
31920 
31980 
32040 
32100 
32160 
32220 
32280 
32340 
32400 
32460 
32520 
32580 
32640 
32700 
32760 
32820 
32880 
32940 
33000 
33060 
33120 
33180 
33240 
33300 
33360 
33420 
33480 
33540 
33600 
33660 
33720 
33780 
33840 
33900 
33960 
34020 
34080 
34140 
34200 
34260 
34320 
34380 
34440 
34500 
34560 
34620 
34680 
34740 
34800 
34860 
34920 
34980 
35040 
35100 
35160 
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ccaatttcaa 
t-gaaatctat 
t-.tttataggt 
ugctgtgatg 
caactcaccc 
ctctttatgt 
cccagagtgc 
aaatttcttc 
^ctgtataa 
tattagtt 
-agctag 
cttct 
^aac 
- a 



. jcca 
ataag 
. ^gctacg 
-catatttac 
gtcccccaac 
ttcatattat 
acacctaaaa 
aatgcaattt 
atttgtttgt 
tgtttttcat 
tcctacagtc 
tcctcccacg 
attttttaat 
tccatcttgt 
gtcattcttt 
cgtaggtttt 
cctactacat 
agcaggtaaa 
gggtcttttt 
attattatta 
gcagtggtgc 
attcagtctc 
tttagtaggg 
tgatccatcc 
tgtaatccca 
catcctggct 
tgtggtggcg 
aacccaggag 
aaagagcgag 
aagtgctggg 
taataatatc 
gtgctttaaa 
ttaggtagaa 
tttactccta 
gccgttactg 
atttgccttc 
attaaagttt 
tctttaaagc 
gagcattttg 



agattttgaa 
gaaataccac 
attatatgta 
tggtcacctc 
tcccatgctc 
tgcccaggct 
tgggattaca 
tgttttcttt 
agactgtgac 
gggaaatgta 
acgccttcaa 
aggtatcaat 
tttaatttgt 
aagaaaacgt 
• — tggacgct 

•ctacct 
-acccg 

c . cage 
- ..agtgctgg 
tattcttctc 
agggctagca 
gttttattgg 
gtgacagaat 
tgtctggccc 
ttcttattat 
acctctaaaa 
aataactcca 
ccaaatttct 
atcaggatct 
tttcttccaa 
tgacttttgc 
ttaaatgata 
gattagacta 
gaggttagca 
cagcattcat 
aaatatatat 
atgagtggct 
ccttatttat 
tatctaattt 
ttattattat 
aatctegget 
ccgagtagct 
aeggggttte 
acctcagcct 
gcactttggg 
aacacggtga 
ggcacctgta 
gcggagcttg 
actctgtctc 
attacaggca 
tcatattttt 
aatgttggtt 
agatatattc 
tatggtcatt 
ctttcagatg 
ttcctttcta 
gttgcaataa 
ttttcagtgt 
taacatcttt 



acgtggggaa 

agtaggttgg 

ttctttgaga 

tcactgcaac 

ggctaatttt 

ggtcttgaac 

gaagtgagcc 

cttttgggta 

tccccatgaa 

gatattttaa 

gctaaaatga 

taatgtataa 

agaaagaaat 

ataacatata 

tgctctgtca 

cccaggttca 

ccaccacgcc 

cagaatggtg 

agttacaggc 

tcagctttga 

aactgeaget 

cacacagcca 

tgaatagttg 

tgagaaagee 

tttgaaacaa 

gataaggatg 

aatttctttt 

aattttctca 

taaaaagatc 

tttatttgtt 

tgeatgeate 

gttggatata 

cttcctaggt 

gcagttaact 

caactgtaat 

taataagtta 

ctaccatacg 

ttgtagccct 

gtaatatgaa 

tattcgagat 

caatgcaccc 

aggattacag 

accatgttgg 

cccaaagtgc 

aggecgagge 

aaccccgtct 

gtcccagcta 

cagtgagccg 

aaaaaaataa 

tgagccacca 

gaccattgaa 

tttatttatc 

ataaacacat 

gtgtttgtgg 

agtaacaagg 

aatggaggtt 

aataattgat 

atatataaag 

caaaattaat 
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aaaatatttt 

aaatcatcat 

cagggtctca 

atccacttcc 

tttttttttt 

tcctgggctc 

acaacacctg 

tacattttct 

agtagtttgg 

ttaatttttt 

tgactaattt 

tttgatgtgg 

agatcagtga 

caaaaacaga 

cccaggctgg 

cgccattctc 

ccgctaattt 

tccatctcct 

gtgagecaac 

taattatcac 

gatgggccaa 

ttcctttcct 

atacagagac 

tgccatcttc 

attattgact 

tcaaaataaa 

aacattatcc 

aaatttaata 

cgtatgtctc 

gatgaaacca 

ttttgtggta 

gagecttgat 

ggttgtgttt 

atgactgatg 

agaaactttt 

aatctaccac 

ttggtggatg 

gtgacttggg 

gctattatta 

ggagtcttgc 

tccacctcct 

gggcctacca 

ccaggctggt 

tgggataggc 

gggtggatca 

ctagtaaaaa 

cttgggaggc 

agatcatgee 

aataaaataa 

cgcccagctg 

ttattaaagg 

tgtttacctg 

acatatacat 

gatttttgee 

tagtgttccc 

attactgtgt 

ggttctaatt 

tatatatcat 

aagagttggt 



agaccccatg 

gagaaactgt 

ccctgttgcc 

tggggctgaa 

tttttaagta 

aagtgattct 

gectaaagat 

tctttttttt 

gtgataattt 

tctttcaggt 

ggttatggcc 

gatgtattgg 

ttgaaaatgt 

agagcataat 

agtgcagtgg 

ctgcctcagc 

ttttgtagtt 

gacctcgtga 

gcgcccagcc 

ctcactatca 

cccagctcac 

ttaggtattg 

aacactgccc 

acttgacatc 

tattttccat 

atcacagaaa 

aaaaaaactg 

atttttacta 

ttttaatgta 

ggtctttgtc 

tgttttaaca 

cacattgaaa 

gtgtgttcat 

tccagtgata 

acttgtcttc 

tcaaaaaaag 

gaaatagtag 

gtaagttatt 

ttattattat 

tttgttgccc 

gggttcaaac 

ccacacctaa 

ctcaaactcc 

egggcaeggt 

cgaggtcagg 

aatacaaaaa 

tgaggcagga 

actgcactcc 

atagataaat 

aagctaatat 

aacctaaacc 

actgtcatca 

tttattcatt 

cgcacatagt 

tggcttctgt 

cagatataat 

ggtactttct 

acagaataaa 

ttttatgttt 



aaataagacc 

aactattttt 

caggctggaa 

gtgatccttg 

gagaccagat 

gctttgtctg 

agtattttta 

aaaaaaaaat 

ategtgaaac 

gaacagtgtg 

aaggaccget 

aaatgtgtgt 

ggtccaggct 

ggacttcttt 

cgtgatcttg 

ctcctgagta 

ttagtagaga 

tccacccgcc 

gagcataatg 

gtcttgattt 

tgectattae 

tctatggctt 

tcaaaaccta 

ccacttcact 

ttataaatat 

taccattatc 

acccccccaa 

ttttttaata 

caggttcatc 

atgtaatatt 

tgttcttctt 

gttgattttt 

cattagttgt 

ctttaattct 

tgtttgatgg 

tagaacaaaa 

atatttggta 

ttgcatgtct 

tattattatt 

aggctggagt 

tattctegtg 

tttttgtatt 

tgacatcaag 

ggctaacgcc 

agattgagac 

actagecagg 

gaatggcatg 

aggctgggca 

aataataata 

tattagctaa 

atagtagtaa 

cctcctttgc 

ctttaattca 

taaaaatgea 

ggctgacagg 

taaatagtgt 

acgtgtttta 

tttgattgtg 

tgtttgatgt 



35220 

35280 

35340 

35400 

35460 

35520 

35580 

35640 

35700 

35760 

35820 

35880 

35940 

36000 

36060 

36120 

36180 

36240 

36300 

36360 

36420 

36480 

36540 

36600 

36660 

36720 

36780 

36840 

36900 

36960 

37020 

37080 

37140 

37200 

37260 

37320 

37380 

37440 

37500 

37560 

37620 

37680 

37740 

37800 

37860 

37920 

37980 

38040 

38100 

38160 

38220 

38280 

38340 

38400 

38460 

38520 

38580 

38640 

38700 
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tatgatatag gacattagaa gtattaatat caattagaga ctcatctttg aatgtgactt 38760 

tgtactttct tatttgtgtt agtagaggag agaacaaaaa gaagatatgt aatgtaatat 38820 

gaaactaggc atttaaagat ttaacgtttt ggatatttta aagttggtgt ctgttttcac 38880 

cctcaaaaat gctattacct atttatgaaa tatctttaaa agtgtggagt ggtagatggg 38940 

aaaggtgaca tcggctgggc gcggtggctc acacctataa tcccagcact ttgggaggcc 39000 

aaggtgggcg gatcacctga ggtcaggagt tcacgaccag tctggtaaca tggtgaaacc 39060 

taatctctac taaaaataca aaaaattagc caggctggtg gtacgcacct gtaatcccag 39120 

ctactcagga ggctgagtca ggaggatggc ttgaacccag aaaatggagg ttgcattgag 39180 

ccaagatggc accactgcac tccagactgg gtgacagaga gagactccgt ctcaaaaaaa 39240 

aaaaaacgcc gggcactgtg gctcacacct gtaatcctag cactttggga gactgaggcg 39300 

agcagatcac ttgaggtcag gagttcgaga ccagctgggt gcctgggcaa catagtgaaa 39360 

ccccgtctct actaaaaata caaaaaaatt agccgggcgt agtggcgggc gcctgtagtc 39420 

ccagctactt gggaggctga ggaaggagaa tggcgtgaac ccgggaggcg gagcttgcag 39480 

tgagccgaga tcccgccact gcactccagc ctgggtgaca gagcgagact ccgtctcaaa 39540 

aaaaaaaaaa aaaaaaaaaa tagccgggca tggtggcggg cacctctaat ctcacctact 39600 

tgggaggttg aggcatgaga attgctcgag cctgggaggc agaggttgca gtaagcagag 39660 

accacaccac tgcactctag cctggatgac agagtgagac tttgtctcaa aacaaaaaca 39720 

aacaaaccaa accacctctt gtccactcct aatctccctt actgtgtttc acttattttt 39780 

ttcccatata tttgtcacct tctaataaac tgtgtaactt attttttatg tttattgtgt 39840 

actatctgtc ttctccctgt tggaatataa actctatgga ggagggatcc ttgtctatat 39900 

cccaagtgcc tacaacagtg tctagcacat gctagttacc gaataaatat ttgccaagtt 39960 

aatgaagttg tttataaccc ttggcactat acctgataca gtgtagggac ttaataaatg 40020 

aatgttaaat gaagctatct taaaaatata tatatatata taacagccag atacgccaat 40080 

ttgccgacat caaaattaat cttttcatct attgcaggtt ttacagttaa gctttgctct 4014 0 

aaggttcact atcactaaac caaaaataaa taatatggat ggtcttttcc catttttaac 4 0200 

agagaggcta catcctctca aaccagtcag tattaggaat tcccaggatc attctctcca 40260 

ttttccatcc taattagata cctatctggc accacatctc tgaaaagctc caatttttaa 40320 

ccagcacata ataaacaaat atgttactat taatacacgt ttgtacacaa gtcattttta 40380 

ttgtcttagg tatatccact cccagacctt ctgagttatt gaaagacagg aatttgtgat 40440 

gtcacctctt ttttcttttt tttgagacgg agtcttgcct tatcacccag gccagagtgc 40500 

aatggcgtga tctcggctca ctgcaacctc tgcctcccgg gttcaagcga ttatcctgcc 40560 

tcatcctcct gagtagctgg gattacaggt ggccctagtt tgggtttttg gttttaaaca 40620 

ggatggtctc ctctttgaga agttgccatg agttagccat gatgatacct gggacaataa 40680 

tggtccacag agaagtaaga gccaatacaa cgccttaaga gaaagtacct ggtatgtttg 40740 

tgaagcagca aagaggccaa tgtgttccag caaggagatt atagtagaga tgaagtcaga 40800 

gaactcatgc ggagagggat tgtcacaaca cgcagggctg taaaggccac catgaggact 40860 

tgagctttta ccgcctgtga aatggggagc agttacaaag atttttaaga aagcagccca 40920 

gtgcagtggc tcatgcctat aatcccagct ctttgggagg ctgaggtggg tggatcacct 40980 

gaggtcagga gttcgagacc agcctggcca acatggcgaa accttgtctt tactaaaaat 41040 

agaaaaatta gctgcgtgtg gtggccatgc ttgtaatccc aaatactcgg gaggctgagg 41100 

cagaagaatc acttgaaccc gggaggcgga ggttgcagtg agccgaggtt gcgccactgc 41160 

cctccagcct gggcaacaaa gcgagactcc gtctcaaagc cagaaaaaaa gatttttagg 41220 

aaaggaatga aatactctga cttaaatttt agaaggatca ctctggttgc tatgttgcat 41280 

tatagactct aagggtagaa ccagggagag caattaggac actgttacag taatctagga 41340 

gaaaagtgat agaggcttgc accagggtag tatcaggaga aatggtaaca agtggttgga 41400 

ttatgattat agttgaaggt cgaacaacta gatttgctga tagattggat aaaatggtcc 41460 

tctctttatg gatctcataa tacagtagga gaaacagaca cataaatagt catcactgca 41520 

ggatgggtat tagaaatatt ttgcaagggt gtaaaaggtg ctaagaaagc tttcttgtgt 41580 

gacaaagctg gttaaagaaa gaaaagaaag cttcctagaa gtgaaaccta aaatatacac 41640 

ttagataaat gaataaaagt tatgaaagaa tgtgagggct gggcacagtg gctcatacct 41700 

gtaatcctag cactttggga ggttgagtcg ggggtattgc ttgagtccag gagtttgaaa 41760 

ccagcctgga cagcgtactg agaccccatg tctaaattta aaaaaaaaaa aaatagccag 41820 

gagtggtgat gtgcacctgt agtcctagct acttacttgg gaggctgagg caggaggatt 41880 

gcttgagctc aggaggtcga gactgcagtg agccatgagt acaccactgc actctagtct 41940 

gggtgacaga gtgagaccct gtctcaaaga aaatgaaaag aaaaagaatt tgagaaaaga 42000 

tatgtcagga aaatgtgatg acatgaacaa atactcaaag gcaagaaaag catggtgagt 42060 

aggggagggt acaggttgag acatgaagtt gggattgccg aggcgtaaga ggtataggca 42120 

gatcatggat ggcctggttt gtcataggaa ggagcttggg ctcttatctg tgggcaatgg 42180 

gaagccacta aagggtttta agtagaagag tgttatatgg taaggttttc ctctccagta 42240 
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gatcactcag atgactgtgg gggttggatg tgaggaggta aagcagcaaa gttactgctt 42300 

taatttaaat cattgattaa tctgtacaat cctagtcatt ccaaaaagaa acattagtcc 42360 

tttaacagaa gtgaattggg tctgggcgcg gtggctcacg cctgtaatcc cagtactttg 42420 

ggaggccgag gcgggcagat cacctgaggt caggagtttg agacaagtct ggccaacatg 42480 

gcaaaacctt gtatctacta aaattacaaa aattagctgg gcatgggggc acccacctgt 42540 

aatcccagct attcgggagg ctgaggcagg agactctctt gaacccataa ggcagaggtt 42600 

gcaatgagct gaggtcgcac cactgcgctc cagcctgggc gacagagtga gactccgtct 42660 

ccaaaaaaaa gaaaaaatat tggagcagtt tcacagatgc tgtttactgt tatactgtat 42720 

gtgtctatga ctcctcctcc aagaaaaaaa aaatgaattg gagcaggttc acagaagcaa 42780 

tgtactgtta cactgtatgt gtctgtttct acacatataa atctgaattc tgtgtacacg 42840 

aaaagaaatc ctatagcttt ttattcctag ctataaaaac taagaatata atttctttct 42900 

ttttattaca taatgaatgg ttctgttaac tttttgttaa aatttcattg aggggagtat 42960 

taattcacat ttatgtacgg atgtctacat ttacaaatca gtgtattttt tgatttatgc 43020 

ttttactgag acaaagggtt tctgtctcag catggtcatt taaagagttt atcattgaga 43080 

aaaatcagat gaccaacctg ttagctcaaa aaaaaaaaaa cctccaaggt atattgtatc 43140 

agccagttct aggatacaaa agccatgcag tactttgtgt tttgtgccaa aaagggtagc 43200 

tgctatttga cctgtcccaa aggcatgtgt ggttgtaccg taaaccaagc atggtacctg 43260 

tttgtcaaac tttagaaatg aaagtttaag agagttaata tataggtgct gcatttttta 43320 

tgtattcatt gacttgctgg tacagaagaa aagaatcaat tatgattcag cacaatactc 43380 

cacttgggga agagagtgca gcagtagttt agagtgtcag ggatcaaact gctaccttct 43440 

tgggcttcag ttgctagact taagagaccc agatcttggg aggggttttt gttgttattt 43500 

gatgtggggg taaggttgaa atactccctt ttaattgatt aatataaaaa ataggtaatg 43560 

tagacgtatg tcacaaaatt ttaacaagtt tgagtgtgaa aagcatccat cccattctat 43620 

gccctggcta cccatttccc ctccctagag gcggctgtta ttatcagttt ctctgggtcc 43680 

tttttagagg taatcttttt gtatgcaact gtgcacatgt atgtttacac aaatggtagg 43740 

gtattgtata tatatacagt tactgcagta tgcttatttg actttgcttt attgctttta 43800 

ttttctgcct gacatatgtt aatgtggcca aatagggcat ttcccagaca atccttatag 43860 

tttcattctg tgctacttta aatgctgttc tccttccctg aaatgtcctt tttttttttc 43920 

ttttcttttt ttttttttga gacagagtct cgctctgtca cccaggctgg agtgcagtgg 43980 

cacaatctca gctcactgca acctccacct ccccggttta agccattccc ctgcctcagc 44040 

ttcccgagta gttgggacta caggcgcgtg ccaccacgcc cggatacttt tttgtttgtt 44100 

tgttttagta gagacagggt ttcactgtgt tagccaggat cgcctcaatc tcctgacctc 44160 

ctgatctgcc tgcctcagcc tcccaaagtg ctgggattac agacgtgagc cactgcgcct 44220 

ggctgtcctt tcttttaatc ttttcaaatt ctagccagtt catagcccac ttgctctgta 44280 

aagctttttc agtgatcttt cttttgtacc atgcagtctt ttaaaaaatc tacagtttta 44340 

ttataagttg ctaattatat ttaataaata cctaaatggt agaaattgat tcatttttta 44400 

atctccgtag tgccaggaac tgtggctcat gtctgtaatc cctgcacttt gggaggctaa 44460 

ggcgggagga tcgcttaagg . ccaggagctt gagcccagcc tgtggaacat attgagaccc 44520 

cgtctctaca aaaaataaat tagctgggca tagtggtgtc tgtatgtagt gtcaactact 44580 

caggagactg aggcagaagg ataacttgag ctcagggagt tgaggccaca gtgagccatg 44640 

atggtgccac tgtacttcag cctgggtgac agagcaagac caagaccgat aattatctcc 44700 

atggtatttg ttttggacgt attagatatt cagtaaatat tttctggtga tgatagtgat 44760 

atctaactac ctcaggttac ctaacctgaa taaggcctat ttttaacata gccattcact 44820 

tgttaatttc tgttattttc gtgacttcat ttttactaat tatattttaa aagataattt 44880 

tatataaatg caaaaacttt ttatcatgta acaatctggt aacaccttga gtaatttgtc 44940 

atttcacatg cacattttat ttgttcatta tcttttttct ttttgtttat tttttctgtt 45000 

ttttaccttc tctgttgcat agagaagatg caaccagttt tgccattttc caagtcacaa 45060 

acggacgtct ataatgacag tactaacttg gcatgccgca atggacatct ccagtcaggt 45120 

gggtttaggt taactaacat aaaataataa agcttgcatg caaagtaaga gtcttactta 45180 

acctgataat gttgatttga ttttataatg gtaggtttaa ttgttcatgt tttcacaggg 45240 

ctgtgttgaa aatatagtac ctttatcatc atagtatata aacatgcaac aagtcaggta 45300 

tagtcattct aaacttgctt tatttgcata ttttgcaacc tctggttttt cagattataa 45360 

aatatgaagg tatacattcc cgtaagtgat taaaataatc tttttttctg ttgtggcttt 45420 

tgtgttttta tatggatagc tatactgatt tttttcatga aatagtgttt tctaagacac 45480 

attttaattt tttatgtatc aatttttatt gcatatcaat tttcatttat agtatatgtg 45540 

aatgtcttat agtacttgat agaagaaatt tgaaacttca catagtgagg agaaacatta 45600 

cagtattatt tgctatggat taactctatc cttcataaac ttttggatat caacttctac 45660 

agaagattaa atgtctttct gttttgtttt ctttgggtag gggactctcc atttcttagg 45720 

ttctctgaca tctgagctag ctttttgttt aattaaaact ttttttttag ttgacagata 45780 
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atgtacctgt tcatggggta cacagtgatg ttttgataca tatagtatat ggtgattaga 

tcaaggtaat tatcatttcc atcatcccaa acatttatca ttccttgtgt tggaaacatt 

cagtattttc cttctagcat ttgaaatgat ataatatatt atattgttac ctataatcat 

cctgcagtga tgtagaacaa tggagcttac tctttctatc tagctatacc tttgtatcct 

ttccctaccc ttttcagcct ctagtatcct ctgttctact ttttatttct atgagattaa 

ctttttaaaa ataatattct gtgtgtatat ataccacatt ttctttattc attcgtctgt 

tcttggacac ctaggttgat tctgtatctt ggctgttgtg aatagtgctg cagtaaacat 

ggqgtgtaga tgtctgttcg atatgatgat tttctttcct ttggataaat tcccaatagt 

gggattggtg ggtcatatgg tagttctgtt tgtagttttt gaggaacctc catactcttc 

tccatagtag ctgtactagt ttagattccc aaaagtagcg tataagagtt cactttctac 

acatcctcac cagcatttgg tacttttttt gtctttttga taatagccat cctaactggg 

gtaagatacc ttgttgtggt tttgatttgc atttccctca taattaacga tgttgagcat 

tttttcatat ctttgttttt gacggtccag ctagttttat tggttacttt tttttttttt 

ttttagcaat agtttcatgt gcagggctca aattatattt aatattactt ttttcaaatt 

ataccagaac aaccttaggt taggctataa aacaactgcc ttctttttct tttggcataa 

taattatata tatattttta attacacttt acgttctagg gtgcatgtgc acaacatgca 

ggtttgttac atatgtatac aagtgccatg ttggtgtgcc gcacccatta acttgtcatt 

tacattaggt atatctccta atgctacccc tcccctctcc cctcacccca cgacaggccc 

cattgtgtga tgttccccac cctgtgtcca agtgttctca ttgttcagtt cccatctgtg 

agtgagaaca tacggtgttt ggttttctgt ccttgcgata gtttgctcag aatgatggtt 

tccagcttca tccatgtccc tacaaaggac atgaactcat cctttttgat ggctgcttag 

tattccatgg tgtatatgtg ccatattttc ttagtccagt ctatcattga tggacatttg 

cattgattcc aagtctttgc tattgtgaat agtgccacag taaacataca tgtgcatgtg 

tctttatagc agcatgattt ataatccttt gggtatatac ccagtaatgg gatggctggg 

tcaaatggta tttctagttc tagatccttg aggaatcgcc acactgtctt ccacaatggt 

tgaactagtt tacgttccca tcaacagtgt aaaagtgttc ctgtttctcc acatcctctc 

cagcacctgt tgtttcctga gtttttaatg atcgccattc taactggtgt gagacggtat 

ctcattgtgg ttttgatttg catttctctg atggccagtg atgatgagca ttttttcatg 

tgtcttttgg ctgcataaat gtcttctttt gagaagcatc tgttcatata ctttgcccac 

tttttgatgg ggttgtttga tttttttctt gtaaattttt ttaagttctt tgtagattct 

ggatatcagc cctttgtcag atgggtagat tgcaaaaatt ttctcccatt ctataggttg 

cctgttcact ctgatggtag tttcttttgc tgtgcagaaa ctctttagtt taattagatc 

ccatttgtca attttggctt ttgttgccat tgcttttggt gttttaggca tgaagtcctt 

gcccatgcca gtgcccatgc cagtgtcctg aatggtattg cctagatttt cttctagggt 

ttttatagtt ttagaactaa catttaagtc tttaatccat cttgaattaa tttttgtata 

aggtgtaagg aagggatcca gtttcagctt tgtacgtttg gctagccagt tttcccagca 

ccatttatta aataggaaat cctttcccca tttattgttt ttgtcaggtt tgtcaaagat 

cacatggttg tagatgtgtg gtattatttc tgagggctct gttctgttcc attggtctat 

atctctgttt tggtatcagt accatgctgt tttgattact gtaccttcgt agtatagttt 

gaagtcaggt agcacgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 

gcaggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 

agtcatttgt agcttgatgg ggatggcatt gaatctataa attaccttgg gcagtgtggc 

cattttcatg atattgattc ttcctatcca taagcatgga atgttcttcc atttgtctgt 

gtcctctttt atttcattga gcagtggttt gtagttctcc ttgaagaggt ccttcacatc 

ccttgtaagt tggattccta ggtattttat tctctttgaa gcaattgtga atgggagttc 

actcatgatt tggctgtttg tctgttattg gtgtatagga atgcttgtga tttttgcaca 

ttgattttgt atcctgagac tttgctgaag ttgcttatca gcttaaggag attttgggct 

gagatgatgg ggttttctaa atatacaatc atgtcatctc caaacaggga caatttgact 

ttcttttcct aattggatac cctttatttc tttctcctgc ctgattgccc tggccagaac 

ttccaacact atgttgaaca ggagtggtga gagagggcat ccctgtcttg tgctagcttt 

caaagggaat gcttccagtt tttgcccatt cagtatgata ttygctgtgg gtttgtcata 

aatagctctt attattttga gatacatccc atcaatacct agtttattga gagtttttag 

catgaagggc tgttgaattt tgtcaaaggc cttttctgca tctattgaga taatcatgtg 

gtttttgtct ttggttctgt ttatatgatg gattacgttt attgatttgc atatgttgaa 

ccagccttgc atcccaggga tgaagccaac ttgattgcgt tggataagct ttttgatgtg 

ctgctggatt cggtttgcca gtattttatt gaggattttt gcgttgatgt tcatcaggga 

tattggtcta aaattctctt tgttgtgtct ctgccaggct ttggtatcag gatgatgctg 

gcctcataaa atgagttagg gaggattccc tctttttcta ttgattggaa tcatttcaga 

aggaatggta ccagctcctc tttgtacctc tggtagaatt cagctgtgaa tccatctggt 
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gctgaggagt 

tgagaagaat 

cacttggtgc 

cagtggggtg 

tctagggact 

agttagctct 

tttgatcttt 

ttttgttttc 

tctctgcacg 

caatttgcca 

attgttatgt 

ttgatgcagt 

ttgtaccggt 

tggtagttac 

ttatgaagct 

tgttgaatat 

ttagtctgat 

ttttttccta 

ttgagtagta 

ctaggttggg 

tctccccgtc 

atatttcttg 

gcttcatttc 

ggctactgaa 

ggccatttaa 

caaggttttt 

ttattaccca 

tttgttccgt 

tagaattttc 

gtctttgatg 

attttccttc 

actccagacc 

gaacgacaaa 

ggtatatgag 

atcagggacc 

agaactacta 

ctgccttttg 

tccttgagct 

caagcctcag 

ctcagactgc 

catgggatat 

ggtgggagtc 

gaattcccca 

atgtgggctg 

aaatgcagaa 

tcctatttgg 

ggttttagtg 



49380 

49440 

49500 

49560 

49620 

49680 

49740 

49800 

49860 

49920 

49980 

50040 

50100 

50160 

50220 

50280 

50340 

50400 

50460 

50520 

50580 

50640 

50700 

50760 

50820 

50880 

50940 

51000 

51060 

51120 

51180 

51240 

51300 

51360 

51420 

51480 

51540 

51600 

51660 

51720 

51780 

51840 

51900 

51960 

52020 

52080 

52140 

52200 

52260 

52320 

52380 

52440 

52500 

52560 

52620 

52680 

52740 

52800 

52860 
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gagaagagat 

tcccttgtgg 

gtcagtggca 

gtatcgatat 

agaaggcact 

gttaagtttc 

attctccagc 

atttcatttc 

caaagcaatg 

tccctagtac 

cgactctttt 

caatcttggc 

gattctccca 

ctaatttttt 

actcctgacc 

gagccactgt 

aaatactgga 

aatgtaaaca 

atttcgcata 

catattggct 

agatcactca 

gttttacttg 

ttactacaat 

gcaaagaaaa 

gagtgggccc 

ttaaagaatt 

actagacaat 

acagacaaca 

tgcaggtctg 

tggtttcata 

aaacattttg 

atcaaattgt 

tcccaggctg 

taatttttgt 

tcctgggctc 

gctactgtgc 

tcactctgtc 

tcccgggttc 

gccaccatac 

aggatgatct 

tacaggcctg 

agattatacc 

ctggagtgca 

tttcctgtct 

atttttgtgt 

ctgacttcag 

caccacgcct 

ttctgtttct 

tttaactctt 

ctataatgat 

aagaagactt 

tttagttttg 

tctgtatata 

tacatatata 

tacatatata 

tacatatata 

agttatatca 

cagttatata 

ttgttttttt 



agagtaaaag 

cttcacatct 

gtttccctct 

aagtattttg 

tactgaaaaa 

taaaatatgt 

cctgaagagt 

acatgctaga 

ttctcttcct 

aagttgaata 

ttttttgaga 

tcactgcaac 

cttcatcctc 

gtatttttag 

ttaagtgatc 

gcctagccaa 

gtattttgca 

ttgcaaaatg 

agggatactc 

ttatagctaa 

gacctattag 

gatgagttct 

gtgttatcta 

agtaaagtat 

agatattgga 

gaaagaaaat 

aaaaataata 

gcctcaacag 

tagaaattac 

tacaatgctt 

tgctttgatt 

atactttatt 

gagtacagct 

attttttgta 

aatcatttct 

ctggctggta 

gcccagggtg 

aacccattct 

ccagctgatt 

cgatctcctg 

agccaccatg 

tcagtaaatt 

gtggcacgat 

cagcctcccc 

ttttagtaaa 

gtgatccacc 

ggccttaatt 

ttcctctcac 

tttgctattt 

tccttttttt 

aattcccttc 

atataactaa 

gttatatatg 

gttacatatg 

gttacatatg 

gttacatatg 

aaataactat 

tgtatttgta 

tgtttttttt 



gatttctata 

cccctaagga 

tcccattcct 

cctgtttctt 

aaaaaaacaa 

atttgagatc 

tggtctgtct 

ccccatcatg 

gcaacctgtt 

tccctaatat 

tgaagtcttc 

ctccgcagcc 

ccaagtagct 

tagagatgag 

cacctgccct 

atatccaaaa 

ttttggattt 

caaaaaaatg 

aacccataat 

tttacacagc 

tagtttatta 

ttcacctctc 

ttatacattg 

aacccttact 

tttagcagac 

atggtatcag 

ttctaaagtt 

cagattagag 

taaattgatg 

taactctttt 

ttaatgggtg 

tatatattta 

gaaattagtt 

gagatggggt 

gccgcctcag 

tagctttttt 

gagtgcagtg 

cctgcctcag 

tttgtattct 

acctcgatcc 

cctggctgtt 

tttatttagt 

ttcagctcac 

ggtagctgga 

gatggggttt 

cgcctcggcc 

tttaaatact 

gtagcaacct 

ttttctctta 

tttctatcag 

tgtcactctt 

aaataactat 

tatatgcaca 

tatatgcata 

tatatgcata 

tatatgtata 

gtatatatag 

tatgtgtgta 

tggagatgga 
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gacagaagaa 

cttcttatgt 

tcctctgtct 

ttagcgtggc 

agaaatgtaa 

ccagtaattc 

ttcctttcct 

ttttcctgct 

tgaaaaaatt 

gaaatctgaa 

ctctgtcact 

tcccctaacc 

gggactacag 

gtttcaccat 

ggcctcccaa 

ctttttgagc 

ttgggttaag 

taaaaaccct 

cttttctttt 

attgatgttt 

gtgtcactca 

ttgggaaata 

tccaattttc 

caagaaaaaa 

aaagacttca 

ttaaacagga 

gaaaagtgta 

atagcaaaag 

actctcacgt 

tgctattttt 

tatcacagtt 

tttttttttg 

gggactacag 

ttccccatgt 

actcccagag 

tttttttttt 

gcgcgatctg 

cctcctgagt 

tagtagaaac 

acctgccttg 

ggtatacttt 

ttttgagact 

tgcaacctct 

attagaggtg 

caccatgttg 

tctcaaagtg 

gtaaggctta 

tcacccctag 

ctttctacta 

tttttgataa 

catatattaa 

atgtatatat 

tacatatata 

tacatatata 

cacatatata 

tgtatataca 

ctgtaaatgt 

tacatatata 

gtcttgccct 



acagttggtc 

tggtttggtc 

gatttaaaat 

tgtgaagggc 

gagtccatca 

tactaggata 

tgttatcttg 

gcattcccca 

gaactttgtc 

atccaaaatg 

caggctggag 

ccatccctgt 

gcacctgcca 

gttggtcaag 

agtgttggga 

gcvgacatga 

gatgctgaac 

aagcagttct 

ctgttttctg 

aatacacagt 

cttctggaac 

gtcataccaa 

tactcaaaat 

aagcaatcag 

aagcagctat 

aatctaagta 

gttactgaaa 

aaagattcag 

agcaactttc 

tctcttactt 

atatacatct 

agatagggtc 

gtgggcacca 

tggccagtct 

tgrtgggatt 

tttttttttg 

ggctcactgc 

agctgggact 

agagtttcac 

gcctcccaca 

aaatggatgt 

gagttgctct 

gcctcctggg 

tgtgccacca 

gccaggctgg 

ctgggattac 

taaagaaaag 

tttggtttca 

tatttccaaa 

tcattgactc 

tataactaat 

aactatatat 

gttacatatg 

gttacatatc 

gttacatatg 

tatatagtta 

atatataaac 

gttttttttg 

gtcccccagg 



atcaactctt 

ttacagtata 

gctgtttcaa 

tgacattttc 

catataaata 

aatagcaaaa 

attctctttt 

ctccaccctc 

ttatttcata 

ctctaaaatt 

tgcggtggcg 

gggttcaagc 

ccacacccaa 

ctagtctgag 

ttacagtcat 

tgctcaaagg 

cagtaagtat 

ggtcccaagc 

gttggaaggg 

gagtccaagt 

attctgtgat 

agtctgctta 

tactagacag 

tagaaactgt 

tataatatgt 

gatgatataa 

ttaaaaattt 

tgactttgaa 

acccgtagtt 

tctgtgatgg 

ttacaaactc 

tgactctttc 

ctgtgccagc 

ggtctcaaac 

ataggtgtga 

tgacagagtc 

aacctctgcc 

acagatgcgt 

catgttggcc 

gtgctggcat 

aattcattgc 

gttgcccagg 

tttaagcgat 

tgatcagatt 

tctcgaactc 

aggtgtgagc 

aatattcccc 

tatacagtgt 

tacaatgctt 

cttatggtca 

atatatattg 

gtataagcta 

tatacacaca 

tatatgcata 

tatatgcata 

tatatgtatt 

tatatgtata 

tttttttttt 

ctggaatgca 



52920 

52980 

53040 

53100 

53160 

53220 

53280 

53340 

53400 

53460 

53520 

53580 

53640 

53700 

53760 

53820 

53880 

53940 

54000 

54060 

54120 

54180 

54240 

54300 

54360 

54420 

54480 

54540 

54600 

54660 

54720 

54780 

54840 

54900 

54960 

55020 

55080 

55140 

55200 

55260 

55320 

55380 

55440 

55500 

55560 

55620 

55680 

55740 

55800 

55860 

55920 

55980 

56040 

56100 

56160 

56220 

56280 

56340 

56400 
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gtggtgctat cttggcttac cgcaacctct gcttcccagg ttcaagcaat tctcctgctt 56460 

cagtctcccg agtacctggg attacaggca cgtggcacca cgccaggcta attttttgta 56520 

tctttagtag aaatggggtt tcaccatgtt ggccaggctg ttctcaaact cctgacctcg 56580 

tgatccaccc gcctcggcct cccaaagtgc tgggattaca ggcgtgagca ccgcgcctgg 56640 

tccctataca tatatagtta tatataccta tagttatttt tagttatatc aaaataacta 56700 

tatgtatatg taactatata tatagtatat atagtatata tatactatat agtgtgtata 56760 

tatagtatat atatactata tagtgtgtat atatagtata tatatagtgt atatatcgta 56820 

tatacactat atactatata gtgtatatat agtatatgta gtatatatag tatatatagg 56880 

atagtatata tagtatatat agtgtatata tactgtatat ataggtgtac atagtatact 56940 

atatagtata catatagtac actgtatagt atatatagta tagtatatat agtatacata 57000 

gtatactata tatagtatag tatacatagt atactatata gtatatagag tatatataca 57060 

gtatactata tagtatatag agtatatata cagtatacta tatcgtgtgt atagagtata 57120 

tatacagtat actatatcgt gtgtatagag tatatataca gtatactata tcgtgtgtat 57180 

agagtatata tacagtatac tatatcgtgt gtatagagta tatatacagt atactatatc 57240 

gtgtgtatag agtatatata cagtatacta tatcgtgtgt atagagtata tatacagtat 57300 

actatatcgt gtgtatagag tatatataca gtatactata tagtgtgtat agagtatata 57360 

tacagtatac tatatagtgt gtatagagta tatatacagt atactatata gtgtgtatag 57420 

agtatatata cagtatacta tatagtgtgt atagcgtata tatacagtat actatatagt 57480 

gtgtatagcg tatatataca gtatactata tagtgtgtat agcgtatata tacagtatac 57540 

tgtatagtgt gtatagcgta tatatacagt atactgtata gtgtgtatag cgtatatata 57600 

gtatactgta tagcgtatag agtatatata tagtatactg tatagtgtat agagtatata 57660 

tatagtatac tgtatagtat atagagtata tatagttaca tatacatata gttattttta 57720 

gtaatatcaa aaaaccatag ctaagatttt tatgatttag caaaatattg tttaccccaa 57780 

agccacgtat tatatattaa tgatattttt tcccttttga gtttttcttc cccacaggtt 57840 

ttctgatctt tttttttgtt ctctaacttt atattatagg tatatactct tttctctgtt 57900 

taatttgctt tttaactaga agacctcctt tagtagttct tttagtgaat atctgtggtt 57960 

aaactcttag tctttccagt gtctgaaata ccctcatttt aatgtgacag gtcacttttc 58020 

tcacctcaac attttggaca tacctcattt ccaacaaaca tttgttactt ctgatagaga 58080 

gtctgctgtc attctcatac ttgttccttg tggaaatgtc tatatataaa gtctcagaac 58140 

tatatatttt taatatatat acatattttt atttatttaa aaatgtataa ttaagttagt 58200 

agtagtagta gtagtagtag tagtagtagt agtagtagtt tttttttttt tagatggagc 58260 

ctccatctcc cgggttcaag tgattctcct gcctcagcct cctgagtagc tgggattaca 58320 

ggcacacacc accatgcctg gctaattttt gtattttgag tggagatggg gtttcaccat 58380 

gttggccagg ctgatcttaa actcctgacc tcagatggac cacctgcttt ggcctcccaa 58440 

agcgctagga ttacaggcat gaaccactgc gtctggcctt aagttattat tgactattga 58500 

tgccctgttg ctctatcaag tagtaggtct tatttattct agaacctcgt tttaaggtat 58560 

cctgaatgtg gctttttttt ttttttttcc taagacggag tctcactctg ttgcccaggc 58620 

tggagtgcaa tggagtgatc ttggctcacc gcaatctctg cctccttggt tcaagcaatt 58680 

ctcctgcctc agcctcctga gtagctgaga ttacaggcgc acgccaccac acctggctaa 58740 

tttttgtgtt tttagtagag acggggtttc accacattgg tcaggcttgt ctcaaactcc 58800 

tgaccttgtg atccgcccac cttggcctcc gaaagttctg ggattacagg cgtaagccac 58860 

cacgcccagc ctaatgtgga ttttgttttt ttttttaact tgaattttat ttatacttcc 58920 

tigattttata atagttaact tgtagtaaaa gtaaactggt tgtctaaata aataagctga 58980 

tttcctatac tagtttagag tctttagttt tcttaaaccg tattaagaga tttgattaca 59040 

aaagtaaaat tgaggctttt gtcttttttt ttggccactc taatttgctg actgacttaa 59100 

catttgtctt cacagtaaac attgtaaata aacactgatg tttgttgcgt agtatgtaaa 59160 

aatattattt aggagtggtg agatttaaac atttacaaac ctgtaatata tatagtacag 59220 

caacactgga caaataacct tttcaactta atcagaggtg ttctataaat gttcatttgc 59280 

atatatacag cccatataat acttagcata tgtaaaagca catctttata ctctttcaat 59340 

taaaattgat tattattatt attttttttt tgagacagag tccctctcag tcacccaggc 59400 

tggattgcag tggtgtgatc agggctcact gcaatcgggt agctggaact acagggatgt 59460 

gccaccacgc ccagctattt ttgtattttt agtggagatg gggtttcacc atgttggcca 59520 

ggctggtctt gaactccata cctcaggtga tctgcccgcc tcagcctccc aaatagctgg 59580 

gataacaggc gtgagctact gcacccggcc taaaattgat tagtttttaa gaccctcttg 59640 

gtgggaacag actttcatag tgtttatagt tataatagtt tggaatcaaa gtagtcgagt 59700 

gctacttttt tttcctctgt acatcctatc cctaatgcct ttactatatt ttgtttctta 59760 

tttgagagct ttatttgctt cataactttt tttttttttt tttttttttg agacagagtt 59820 

tcactctgtc acccaggctg gagtgcagta gtgcaatctc ggcttactgc aacctccgcc 59880 

tcctgagttc aagtgattct cctgcctcag cctccgaagt agctgggatt ataggccccc 59940 
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accaccacgt ctgactgatt ttttgtattt ttagcagaga cgaggtttca ccatgttggc 60000 

cagcctggtc ttgaactact gacatcaggt gatccgtcca cctcgatctc ccaaagtgct 60060 

gggattacag gtgtgagcca tcgcgcccgg cgcttcataa cctttttata ttgtctttct 60120 

gttccccaaa atgaagtagt ttcttcttaa aaatactgtt ttttgttttt ttgttttttt 60180 

ttttatttga gatggaatct ctctctgtcg ccaggctgga gtgcagtggc acgatctcgg 60240 

ctcacttcaa cctctgactc cgtggttcaa gcaattctcc tgcctcagcc tcccaggtag 60300 

ctgggattac aggcacaaat actgttttta ataagaaaat tagaataggg acaggcacaa 60360 

tggctcactc ttgtaatccc agcactttgg gaggccaagg tgggaggatt gcctgagccc 60420 

aggagttcga gaccagccta ggcaacatag tgagtgagac cctgtttcta taaaaaaaat 60480 

ttttaattag tccggtctgg tggtgcacaa ctgatgtccc agctacttgg gagtttgagg 60540 

tgggaggatg gatcacttga gcccaggaag attaaggcca caatgagctg tgatcatgcc 60600 

actgcactcc agcccaggcc acaggtttca aaaaaagaga aaattagaat tatacgttag 60660 

ggggaaaaaa cctaataacc atattcctat ctacctagtg accaccccta tgaagatcct 60720 

ggtacatgtt ctcattgaaa tcttattttg aaatattttt gaattaaaaa aatatattat 60780 

taccttggtt ttacaaatgt ttgcttgtct ttatgttcag ctacaatttt ctaatcacaa 60840 

tggttttact ttttccttgt cagaaagtgg agctgttcca aaaagaaaag accccttaac 60900 

acacactagt aattcactgc ctcgttcaaa aacagttatg aaaactggat ctgcaggcct 60960 

ttcaggccac catagagcac ctagttacag tggtttatcc atggtttctg gagtgaaaca 61020 

gggatctggt cctgctccta ccactcataa ggtattctgg gacagtaact ttaattgctg 61080 

tctttttgca aatagaaaaa tttttaagat actattcctg cttaagttga tcataagtac 61140 

tttataatac tttagagaat ggataagttt ccataaagtt aaattttttt tttttttttt 61200 

tgagactctt gttttccagg ctggagtgca atggcgcgat ctcggctcat tgcaacctcc 61260 

gcctcccagg ttcaagcgat tctcctgcct cagcctccca agtagctggg attacaggca 61320 

tgcaccacca cgtcgagcta attttgtatt tttagtagag acggggtttc tccatgttgg 61380 

tcaggctggt ctcaaactcc cgacctcagg tgatccgcct gcctcagcct cccaaagtac 61440 

tgggattaca ggcgtgagcc accgtgccca aagttaattt ttttttaaat ccacagggca 61500 

acttgctata aaactttttt tggacctcat tagacattta ataccaagtt ttgcttaccc 61560 

agtctgtttt atataatgct gtatatttca ttttaaattt atttttaaaa ttatttcaat 61620 

ctttgtaaat gttttatacc agtaacatac ctagagtttt gtcatgattc taacaagggt 61680 

taaaatttgt ttttattttg taaaaactaa atctctggat aaaatcctct ataactgact 61740 

taatgccaaa tatagttctc tagtgaatac agttttacct tcaggtaaat aaatatacaa 61800 

tttatggatt tttataccct ttttcctatt tttaaagctt gaattctgtg aactttaagg 61860 

ttaacttatt tatgaaaagt gtaaatgtta ggttgtattt tcatattaaa attttgtatc 61920 

ctttaagggt actccgaaaa caaataggac aaataaacct tctaccccta caactgctac 61980 

tcgtaagaaa aaagacttga agaattttag gaatgtggac agcaaccttg ctaaccttat 62040 

aatgaatgaa attgtggaca agtaagtttt gccatctaaa tgttttattt tatagttttt 62100 

atattttaat tttacttata aaacatgtca ggagtgaaat agataataaa taccttgtct 62160 

ggtttacata cttaattttt atgatagttt tcaattataa atgtagaaaa ccattgcttt 62220 

actgatttaa ctatagttta acagttaaca ttaaaaataa ctatatgtca tagggcttag 62280 

gcttcatctt gtaataactg ggccctgttt gtatcgtaga actaactgag gtcttgtttc 62340 

ttagtggaac agctgttaaa tttgatgata tagctggtca agacttggca aaacaagcat 62400 

tgcaagaaat tgttattctt ccttctctga ggcctgaggt aagaacttta tattatcatt 62460 

tttctataat accatctgtt actgaatcca tagtagtagt agtagtaaag aaatatttga 62520 

gctatactaa aataattaat tcatataagg taacaataga tttaatgttt taaaaaagat 62580 

aaaacattaa caattgatgt tgagaagtta ttatagaata ggaaaatgga tatgagttcc 62640 

taatttccaa tccttttata tttttaggaa aagtgggtag tatgatataa ttttgttttg 62700 

ttttggagac ggagtctcac tcattgtgtc gcccaggctg gagtgcagtg gcatgatctt 62760 

agctcactgc aacctctgcg tcccagaatt caagtgattc tcctgcctca gcctcccaag 62820 

tagctgggat tacaggcatg tgccactatg cccagctaat ttttgtaatt ttagtagaga 62880 

tggggttttg ctatattggc caggctggtc tttcatacct gatgtcaagt tatccaccca 62940 

tttcggcctc ccagagtgtt aggattacaa gtgtgagtca ctacatctgg ccaaattttg 63000 

atatcaaggt gagagagatt taaaattaag ataaggtaca aaaattagcc tagtgtgggg 63060 

gcgcacgctt gtagtcccaa ctactgggga ggctgtggca ggagaattgc ttgaaccagg 63120 

aggcagaggt tgcagtgagc caagatggca ccactgcact ccatcctggg tgacagagcg 63180 

agatgtcatc tcaaaaacaa aacaggccgg gtacggtagt tcacgcctgt aatcccagca 63240 

ctttgggagg etgaggcggg cagatcacga ggtcaagaga ttgagaccat cctggctaat 63300 

atggtgaaac cctgtcttta ctaaaattac aaaaattagc tgggcttggt ggtgtgtaac 63360 

cccagctact cgggatgctg aggcaggaga atcgcttgaa cccgggaggc ggaggttgca 63420 

gtgagccgag atcacgccac tgcactccag cctggcgaca gagcgagact ccgtctcaaa 63480 
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aaaataaata 

ggaaatcagg 

aaatgccgct 

taataaacaa 

tgtactggag 

gaattttgct 

tctgcctttg 

gcatgcaccc 

ttggccaggc 

gtgctgggat 

gacttttaag 

taatcttcca 

ataaatattt 

tatttagtgc 

cagttatttc 

aagttgtgtg 

tgtctcaatt 

tgtaagtgag 

ttactcattc 

cccagtaaaa 

tttatgtcat 

cattttgctg 

ttgcttaaag 

gattcattga 

agtggtagac 

ccacctaatt 

taaaattgtg 

tttgctttac 

atttaggcat 

aaatgccagt 

aaccttagta 

gtctaaaggt 

actttttttc 

tttcacaata 

ataacacgcc 

cttgcataga 

tcttgagtat 

aaaactggtt 

ttacttaaaa 

tattgaaaaa 

aacattaaac 

aatagcagaa 

tatatcacag 

cttctgtcct 

cttttatatt 

agaatgtgat 

tttctttctt 

cttaggctta 

catgaatttc 

tcaaaaatgt 

taccttttcg 

cacacacctt 

tttagtgctt 

cagccttttt 

cgattgataa 

aacctgttaa 

accttcttct 

ctaatctgtc 

tctcctgtct 



aaaatttaaa 
caggtagtgg 
caaagagtgt 
gtactttatg 
aaaagaggaa 
cctgttaccc 
gggttcaagt 
caacacctgg 
tggtctcaaa 
tacaggcaga 
gatattaagt 
tcccatattt 
ggctttccat 
tgttccaata 
actattaaca 
gcacgttgtg 
tttccatagt 
taccaactgt 
taagtacata 
taattagata 
gtaccacctc 
gagttatata 
aggatttaca 
taaagaaact 
ctaggaaata 
cttacattta 
aaggtaatac 
ccaggcctat 
attttcatgg 
tgcaagttat 
aacttagcaa 
ttatatcctg 
cttgtagttc 
gactcacaaa 
tctattgtgt 
ccacaataga 
actggaattt 
ttaaggagat 
taagtgcttt 
cttctccatc 
ataatttttg 
aatagaacat 
tgatctgtct 
tatttcatag 
tcttattttg 
tgttctccag 
tctttttttt 
agtgatcctc 
caaatatgat 
tagaacttac 
aatctattaa 
ctactcctgt 
ttaaatatta 
ttcccctaaa 
ttcttctgtt 
ctcaggtctt 
tttcattcga 
ttcactacca 
tttaaattcc 



aagataaata 
cccctgacac 
ggtaaactcc 
ggaaagtttt 
ttcaggtaga 
aggctggagt 
gattctcatg 
ctaatttttg 
ctcctggctt 
ggccactgtg 
catcaaagta 
tatgacttat 
acttagcacc 
atattgcaaa 
ttaaaatctt 
gtgggtgcat 
cttgagtcat 
actagaactt 
aaatcactgg 
attattaaaa 
aggtcacact 
agattagtaa 
taattgtaga 
agtcctaaga 
cctttctaag 
tttattaagg 
caaggaaata 
agagaacata 
tagtgacata 
ttcaaataaa 
actgagacct 
gtacaaactt 
agatttccaa 
atgaatcttg 
aaaaaaatca 
gacattgtta 
ttatttcatt 
aatactaaag 
aaatcttgct 
ttccttcaat 
aaagtagcca 
gccctctcct 
aaatattttt 
atctcttctg 
ttctcttgct 
ttttaaaaag 
tttttgattg 
ctgtctcagc 
gttatctttc 
ctctttaaat 
cttgcatatc 
cctcccactt 
ttcattacca 
taattgtgtt 
ccatttcagt 
tttttttttt 
gaccaaatgc 
tcataatttc 
atattttcca 



cataaaaata 
aatgagtttt 
atcgaaggct 
ttttttaatt 
ataattcttt 
gcagtggctt 
cctcatcctc 
tgtttttagt 
cagatgatcc 
cctggcatga 
gatagagcca 
taaggaagat 
gttttgaatt 
aaataaatct 
acggacctac 
tattaaataa 
tcacatactg 
actgaatatt 
tctgatatgc 
tagaaagcat 
ttgggaaacg 
atgctataga 
cctgaaaagg 
gctaaaatga 
attagagctg 
gacatgcttt 
tttaggctat 
tctaaaataa 
atgtgcaatt 
gttgaataac 
aaggaagagc 
gtctatacat 
gaaagggaat 
ttaagcctat 
gctttattcc 
gattatatca 
gtagaaacac 
atactcactt 
cattcatgaa 
cccataggac 
atattaatct 
ctcgcccaaa 
ctcaaatatt 
tatcctgtgc 
gcttaaatgt 
ctcttctcta 
agacagtctc 
ctcccaagta 
atataagctt 
aatcttataa 
atagtaaatg 
tttctcaccc 
agccaagtag 
attttttcat 
ctaatttcca 
ttttttccca 
tttccatgcc 
cttttccttt 
ctttcatgat 



aataaataat 
cccagaattg 
aaataccaac 
atttttaaaa 
tttttttttt 
gatgttggct 
ctgagtagct 
agagataggg 
gcccaccttg 
agaacaattt 
ttaaatgatg 
aggcaatctt 
tttccagttc 
gaagactcac 
ctgcaacatg 
atgtgcaaag 
cctttatggt 
tttcaagtct 
aagttaggtt 
ttgtcattat 
tagcttacgt 
ctaaatattg 
atcttagcag 
cttgctcaag 
cctggttagt 
ttacggtaga 
gcaagaaaag 
taagtaacat 
aagaagctat 
ctgacctcag 
aagatctgtg 
caccacacct 
attattgtcc 
gaatgggtaa 
taattccctg 
agaaggtgag 
agaatcataa 
gaggtagatt 
gccatagccc 
catgttttta 
ttgacaaaaa 
agtaagacta 
ttactaagaa 
agcttgtcta 
gattctttga 
tctactaaaa 
gctgtgttct 
gctgagatta 
aaacataagc 
agccatttct 
aacccttagc 
aggctggagt 
cgtactattt 
ttgcttcatt 
catggccaaa 
gaataccttt 
tgtgtcaaag 
tttcctttct 
ttattttctc 



attaagagaa 
gattgcttgg 
gtgacagtga 
agagagaaat 
ttttgagatg 
cactgcaacc 
gggtctatag 
ttttaccatt 
gcttcccaaa 
ttaaaagaat 
ggtagaaacc 
gcagttgata 
acagatggta 
ttctgggtca 
tagtggaaat 
gttttatggc 
gtttatcact 
attttactta 
ttcgctaata 
gtgaactgga 
attgagctaa 
aaaaaaaagc 
tcttctgatc 
attttagtta 
gctatagctg 
aaaatatatc 
tcattcagct 
gtgaatttga 
aataatgtaa 
gaggggcaga 
gtagagccag 
gccaaatgga 
tagctcagcg 
gacttatccc 
tagtaggaag 
tggcaggcat 
ttagtcatct 
gttctcagaa 
tggaaggaga 
attgtagttt 
actcaaacta 
cattttaaag 
agcgtatatt 
tcatttcgag 
gatttataga 
tttccatgaa 
ccagcgtggc 
cagaaatttc 
ctttcttctt 
taatttttgt 
tccatcatac 
acagtgaata 
tttccttgta 
ttcatcttat 
ccaatctaaa 
tcctggaacc 
tggttgttct 
ttattatgta 
attttgatgg 
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ctacatcttt cagtaactga gaaaaggttg tgtgagggaa tattttgaga tgctgtagtt 67080 

ttgaaaatat ctttattctg ctgtcttctc attaataatt tgactgcatg tcaagattta 67140 

agttggaaac tattttccat gagtattttg aaggcattat ctattgtctt ctagcttcca 67200 

gtgctgcttt gtattagaga cagaagatca ggaatcagga tagcattgga cttcttattt 67260 

ctatttccca aagctttttg gatcttctct ttattcttat cttctgatat tttataatga 67320 

tatgcttgat gcatttactt tttcttttct tcttccctct tgtacatttc tttctttttt 67380 

taggtggggg caggggggaa ggagtctcac tcttctcacc caggctagag tgcagtggtg 67440 

caacctcagc tcactgcaac ctccacctct ggggttcaag cgattctcct gcctcagcct 67500 

cccgagtagc tgggattaca ggcatctgcc accacgccca , gctaattttt gtatttttag 67560 

tagagacggg gtttcaggct ggtcttgaac tcctgacctc aggtgatccg ccctcctcag 67620 

cctcccaaag tgctgggatt agaggcatga gccactgcgc ccagcccctc ttggaccttt 67680 

ctagatattc atccttcaat tctgagaaag gttctataat tctttaattt aaaaaaagtt 67740 

tttttgtttc atctttctca cttttttttt tttttttttt ttttaagaca cagtcttgct 67800 

ctgtcaccca ggctggagtg cagtggtgcg atctcagctc actgcgccct tcgcctcctg 67860 

ggttcgagtg attctcctgc ctcagcctcc caagcagctg ggattacagg tgcccaccac 67920 

caccatgccc ggctaattgt tgtattttta gtagagacgg agtttcacca tgttggccag 67980 

gctggtttca aactcctgac ctcaggtgat ccacctgctt tggcctccca gagtgctggg 68040 

attacaggca tgagccaccg tgcccagccc tattctgatt tcatagatgc agtgtctttt 68100 

atgtctctga gaggttttgt caagttttct tttgtttact ttattatctg tttcttcaag 68160 

attcctcctc ttttcttttt gccttaagct ttttcatatt ggaagcttct ctcaaatgtc 68220 

tggttattct ggttgtccac ttatattacg tggaacaata aaaaagttga ttaggactct 68280 

gtgctgtaag taagtaaatt gttgatagtg agagcccatt aatcacagga tgatcaagca 68340 

gcaagcctac tgtttatttg ggtttctcca aatggctata gctgtcagtc ttttttttct 68400 

ggggttattt ggcttctcta gaaaagaatt ttctagtctc ttgtttggag aatacaagct 68460 

tgactattgg tgttccagaa aatgggtggg aggagacgac tttgttttct gttaggttga 68520 

gccatgtgaa attactaggt tttgttttgt tttctgtttt gttttgagac agagtctcac 68580 

tctgttgccc aggctggagt gccttagcat gatcttggct cactgcaacc tctgcctccc 68640 

aggttcaagc aattctcatg cctcagcctc ccaagtagct gggattatag gcatgcacca 68700 

ccacgcctgg ctaatttttg tatttttagt agagacgggg ttttgccatg ttgaccagtc 68760 

tagtctcgaa ctcctgacct caggtgatcc acctgccttg gcctcccaaa gtgctgggat 68820 

tacaggtatg agccaccaca cctgggctga aattactgtt tttataggtc aaaaacagtt 68880 

gagggatagg catggtggct cccacctata atcccagcac tttcagaggc caaggcagga 68940 

agattgcttg agtccaggag ttcgacacca gcctgggcaa tgtagtgaaa ccccatctat 69000 

atttaaaaaa aaaaaataga tgaatatctt tgtttgcaga taacatgatt gcatatgtag 69060 

aaaatcccaa agaaccaaca aaaagagctc ctagaactaa taagtgatta tgacaaggtg 69120 

tagaatacaa agttaatata caaagtcaca ttgctttttt atctaccagc agtgaacaac 69180 

tggaatttga aattaaaaca caatactgct gggtgcagtg gctcacacct gtaatcccag 69240 

cactttggga ggccgaggtg ggcagatcac ctgatgtcag gggttcaaga ccagcctgac 69300 

caatatggtg aaaccccatc tctactaaaa atacaaaaat tagctgggca tggtggcggg 69360 

tgcctgtaat ctcagctact caggaggctg aggcaggaga atcgcttgaa cccaggaggc 69420 

agaggttgca gtgagccaag atcgcgccat tgcactccag cctgggggac agagcaagac 69480 

tccgtctcaa aaaaaaaaac acaatacctt tcatattaac actaataaaa tgaaatatgt 69540 

gtagttctaa caaagtttgt tgtagaagat ctatatgaga agaattatag cactcatgaa 69600 

agaaatcaaa gatctaagta aactgagaga tattccatgt aaatggacag ggagactaaa 69660 

tattattgag atgtcagttc ttcccaagtt catatatcga ttcagtgcag tcccagtcaa 69720 

accccagcca gttattttgt ggatactggc aaactaaagt ttatatgaaa aggcaaaaga 69780 

cctagaacag ccaacacagt attgaagaag aaaaaagtca gaggactgaa actacccaat 69840 

ttcaagactt actgtaaagc tacattaatc aagacagcat gtcattggca aaagaataga 69900 

caaataaatc agtagaattg gacagagagc ctagaaatca acccacacag ataaagtcaa 69960 

ctgatctttg gcaaagggac aaagacaatt cagtggagaa aagatagcct tttcaacaaa 70020 

tggtatagga caactggaca tccacatgca aaaaagttaa tctagacaca gacctgacaa 70080 

ctttcacaaa aataaatgga tcatagacct aaatgtaaca tgcgaactga aacttctaga 70140 

ggataacata ggagaaaatc taggataaca tgagaaaaat ttttggtttg gcagtgactt 70200 

cttaggtaca ataccaaaac atgatccttg aaaaaaaaaa tcagtatgtt gaactttgtt 70260 

taaattataa acttctgctc tgtgtaagat gctgttagga gaatgaaaag acatgcagca 70320 

gagtgggaga ctttacaaaa ttcattatct gatgaaggac cagtatccaa aatatacaaa 70380 

gaacttttaa aactcaacaa taagaaaata tacaacccag ttaataaatg ggcaaaatat 70440 

ctgaacagac acctcaccaa ggaagataga tagatgacaa caagcatatg aatatatgct 70500 

caacatcatg tcgttaggga aattgcgcat taaaacaaca acaagatacc ctgccatccc 70560 
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tattagaatg 
agcagaaact 
agttggacag 
atatggtcca 
ataaaaaaaa 
agcagtcaag 
ggagtattat 
ccataaatgc 
tgactatatg 
ccaagggaga 
tgttctttat 
aatataaaac 
tgaatatttt 
gggaaattgg 
gtaaacctaa 
attttttgag 
gctcactgaa 
gctgagatta 
ggtttctcca 
cggcctccca 
ttaagttgga 
tattaaagtg 
tagtgtccct 
tgctttggtg 
tttcaatcag 
gcccgggttg 
acgccatttt 
ccggctaatt 
ctcgatctcc 
cgtgacgact 
tactgctttc 
acgtcagcgt 
tctgctaagt 
tctccttttc 
gtgggatttc 
tttcattttt 
ttttgagaca 
actgcaccct 
ggagctcagg 
cagagttccc 
tctttgcccc 
tattacatta 
gatgctactg 
tcatagttgt 
agagggctgt 
ttcaaatttg 
tgtccttgag 
tttgtttgtt 
tcaagcgatt 
acctgtctag 
gtcgaactcc 
ggcatgagcc 
gaagtagatg 
gacagtatga 
ctatattgag 
aagtaatcag 
atcaggctct 
gaaagagtaa 
agaagagagg 



gctgaaatct 
ttaattcatt 
ttttttacag 
gcagtcttac 
ctgcacatga 
gcatccataa 
tcagcaataa 
atattgctaa 
atgttttgga 
cagggagaga 
gataatccaa 
ataagagtga 
ttcattagtt 
aaaggaatga 
aatcactaaa 
atggagtttc 
acctccgcct 
caggcatgtg 
tgttggtcag 
aagtgctgtg 
tattagccat 
taggtgagat 
gaatctggag 
gtgattggta 
ttcctgtgtt 
gagtgcagtg 
cctgcctcag 
tttttgtatt 
tgacctcgtg 
gtaagccacc 
tgtggtgcct 
gcttcttgca 
gatttaccac 
tatttttgtt 
taagtagaga 
accaccgagg 
gggtctcact 
tggcctccca 
tgatccagca 
ctatgttgcc 
ctaaagtctg 
atttatgatt 
aaaaaaggat 
aaactaaagt 
tactctttgg 
agttttctgt 
tctattattt 
ttgttttgtt 
ttcatgcctc 
gttttttatt 
tgacctcaag 
actgcacctg 
gaaaaccatg 
ttgtcattat 
tatctttcta 
tatgttatag 
ggatacctct 
cttttcctta 
agaataacac 



aaaacactga 
gctgatggaa 
aactaaagac 
tccttagtat 
atatttctag 
gtaggggaat 
aaagaaatga 
atgaaagaag 
aaaggcaaaa 
tgaataggtg 
tggtggatac 
accctaatgt 
ctaacaagtg 
gaggttatat 
aaaaaagttt 
actcttgttg 
ccagggttca 
ccaccacgcc 
gctggtcttg 
attataggcg 
ttcatatgat 
gttttcagtc 
actctgactt 
cctgcttgac 
tgtttgtttg 
gcgcaatctt 
cctcctgagt 
tttagtagag 
atccgcccgc 
gtgcccggcc 
gataacatcc 
tttaggtatc 
actttatcag 
tggaagattc 
aacatgccta 
agttggtttt 
ttgtcagcca 
agctcaagtg 
cacccagcta 
caagctggtc 
ggattacagg 
atgtgtttcc 
gctttttaga 
atatattttt 
tccacctggg 
tgagatattt 
acgacttgct 
ttgagtgatc 
agcctcccaa 
tttggcagag 
cagtcctcct 
gctgatacac 
tacgttatct 
tttttgtaaa 
acccctgatt 
cttttttttt 
ttcctctgca 
gatgtttgtc 
tgtctctctt 



caacaccaaa 
atctaaaatg 
agtttgacag 
ttacccaaat 
cagcattatt 
ggataaacag 
tctatcaagc 
ccagtctgaa 
ctatggaaac 
gagcacagtg 
atgtcattat 
aaaatatgga 
tactacacta 
gggaactctg 
atttttattt 
cccaggctgg 
agcgattctc 
cagctaattt 
aactcctgat 
tgagcagctg 
tcaacttaaa 
tggagctcta 
atttctttag 
tgcctttggt 
tttgtttttg 
ggctcaatac 
agctgggacg 
acggggtttc 
cttggcctcc 
agttcctctg 
aattcctgaa 
ccttcacaag 
ttctccattt 
atatattttt 
tgttcaatat 
atttcttttt 
ggctggagta 
atcctcccac 
attttttttt 
ttgaactctt 
tgtgagccac 
tttaaagcta 
tggcaaagag 
tagttgttca 
aatgggaaga 
gggataatat 
ttttgctatt 
tgggctcacc 
gtagctggga 
acaggatttc 
acctgggcct 
ttttaagttt 
tcagtagtgt 
ttaaattttt 
tttgcttcta 
tttttaagta 
tagtcctcct 
tttctcaaag 
tttttttaaa 



ttctggcagg 
gtagaaccat 
ttt:cttacaa 
aagtttaaaa 
catagttgcc 
actttggtat 
cacaaaaata 
gaggctacac 
agtaaataga 
gatttttaag 
acctttgtca 
cttcagttaa 
atacaagata 
tactttctgc 
ttattttttt 
aatacaatgg 
atgcctcaac 
tgcagtttta 
ctcaggggat 
cgcccagcag 
agtacataca 
cccttgattc 
agaacgaaac 
ggggagttcc 
agacggagtt 
acgctccgcc 
acaggcaccc 
atcgtgttag 
caaagtgctg 
tttttgactg 
ccttcctggg 
taggcattta 
tgtggaattc 
tattcattta 
gtcttgttta 
tttttttttt 
cagtggcaca 
ctcagcctcc 
tttttaattt 
gggctcatgt 
caca cccagc 
tgggcagctc 
tacttaaaat 
cagggcttag 
caatgctggt 
gaaaaaaaga 
gtacactttt 
gcaacctccg 
ttacaggcac 
gccatgttgg 
cctaaagtga 
ttcagctact 
gtttttggtt 
acctggaaga 
ctatcataat 
ttcttttgcc 
ggatggaaga 
cagttatctt 
tctctctcta 



gatgtggagc 

tttggaaggt 

aactcttacc 

tgtacatcca 

aaaacttgga 

atcatgtaat 

tatggaggaa 

tataggattc 

tcagtggttg 

gcagtgaaac 

aaacccacag 

taataatata 

ttcagagtag 

tcaattttct 

ttaattttta 

cacgatctcg 

ctcccgagta 

gtagagacag 

ctgcccgcct 

gttttttttt 

ccttcactgt 

ctgccatgcc 

tcctgccttc 

tcataccaac 

ttgctctgtc 

tcccgggttc 

gccaccacgc 

ccaggatggt 

ggattacagg 

cctgccttac 

atttttgttc 

ggttttaagc 

attgtgttaa 

gtattttttg 

agcagtctgc 

tttttttttt 

atcaaagctc 

tgaatagctg 

tttgtagaag 

aatcctcctg 

tgtttttaat 

tgtttgggaa 

gtctctagaa 

agctcctgcc 

aagggttctc 

aactttatct 

gttttttttg 

cctcctgggt 

acgccaccac 

ccaggctggt 

tgggattaca 

tttcaatgta 

ggttaaattt 

gcttacctta 

aactttattt 

agaagttttt 

aacaaagagg 

tgtatatcta 

ctcattctct 
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ctcaggagga 
aggaacacat 
tttttattaa 
tgtgatctcg 
ttcctgagta 
attagagatg 
tgcgcctgcc 
tcatagctta 
tttaaatgta 
-:agtagctgc 
- tacgtgag 
-taactg 
tattt 

. t 
~r. 

iacac 
jggatttt 
tttctggc 
■cttttttt 
ctgggcttaa 
caccacacct 
tttttccatt 
ttggggtagg 
ctagtgtgta 
cactgctttg 
ataccttagt 
atgcctataa 
tggagaccag 
caggtgtggt 
cttgagcctg 
agtgacagtg 
cctgtaatcc 
ataccaccct 
gacatgccag 
agtcaaggag 
tcagagcaag 
tggcaaacat 
gtttgaagtg 
acgcctgtaa 
tcaaaaccag 
cagacttggt 
ctcgaaccca 
ggcaactgag 
agaggtgatc 
tttactgtct 
tctatgtctt 
tctccctgta 
gagttaaagc 
ccatcactat 
aagactccct 
ttcctcttca 
attcttcaga 
tattattctc 
ttcattgata 



gagtagaaag 
tgattgccat 
tttttttttt 
gctcactacc 
gctgggatta 
ggatttcacc 
tcggcctccg 
catttttaga 
atatattgaa 
agaatcgaat 
tgctctgttt 
taaatggtaa 
acatatgatg 
tgtattagtt 
caatttattg 
-Tttgcttcc 
^gtggctt 
■ .jitttatc 
^gattaggac 
caaataatgt 
agttcaaccc 
atctcaagga 
cttctgattc 
tttataatag 
gcaatcctcc 
ggccagtaga 
caccctctgc 
gcaagcataa 
aatataactg 
tctttctccc 
ctctgcttgc 
tcctagcatt 
cctaggcaac 
ggcatgcacc 
agaggttgag 
tgagaccctg 
cagtactttg 
gggcaacata 
cgaatacgtg 
gttgaggttg 
accacgtctc 
acttaaactg 
tcagcatttg 
tcccagcact 
cctggccaac 
ggtgtgcgcc 
ggaggcagag 
tgagactctg 
accacatgat 
acagttttgc 
cggaacagac 
cctatagaca 
aaacttgaca 
gatagagata 
cttccttagg 
tggagtttcc 
taccagttga 
ctagcaccac 
ggattatttt 



aagcacagct 

gtattgggga 

tagacagtct 

atctcttcct 

caggcatgcg 

atgttggcca 

aaagtgctgg 

gaatcttttc 

ctaatttaat 

gcaaccttct 

ccaatattgt 

tatttcatga 

aatatctatc 

tactggggcc 

tctcacagtt 

tcctgagggc 

gctggcaatc 

tttatgtggc 

ccaccctaat 

cacattcata 

attaacaaat 

gccaccagat 

tgatctaaaa 

agacacagtc 

tgcctcggac 

ttttccctgc 

tgaccctata 

ctacagtgct 

gtgcattgca 

tctctccctt 

ctttatcaaa 

ttgggaggct 

atggtgaaac 

tgtagtccca 

gctgcagtga 

tctcaaagaa 

ggagactgag 

gtgagacccc 

gtcccagcaa 

cagtgagcca 

aaaaacaaaa 

aaatgtgaat 

ttgcaccgaa 

ttgggaagcc 

attgcaaaac 

tgtaatccca 

gttgcagtga 

tctcaaaaaa 

atccagatag 

agcgagagaa 

atgagatcag 

tgtatgggaa 

tgttgaccat 

gccttggtgt 

cagttcttca 

tttctcagga 

aatgttacaa 

ttgcacctca 

aattgtatct 
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cttcctataa 

ttgtattata 

tactctatca 

tctgggttca 

ccaccacgcc 

ggctggtctc 

gattacaggc 

tagtacttaa 

atttgctctt 

ttaatataag 

cgtattttaa 

aaatattttt 

ttcagagtag 

atgtaataaa 

gtggaaggta 

tgtgagggaa 

ttttgtattc 

attctccctg 

gatctcaatt 

ggtactaggg 

actatcactt 

aggaacacag 

tatgacagaa 

tcgctatgtt 

tctcaaagtg 

tttcttttga 

gtattattca 

taaagagagt 

aaactgtgaa 

tctcttggtt 

acctttatga 

gaggcaggaa 

cccatctctt 

gctactcagg 

actgtgatca 

acaaaacaag 

gcaggaggat 

catctctaca 

atcaggaggc 

cgatcatgcc 

caaaacaaac 

ctctgatgaa 

atccagaggt 

aaggctggca 

cccgtctcga 

gctattcggg 

gccgagatgg 

aaaaaaaaaa 

cctctttcca 

acttgatttt 

aattgtctag 

acttatttgt 

agttgttatg 

tggacccata 

aatattatta 

acactatctt 

ccttccctga 

ttttcatact 

gatatcactg 



cctgtcctta 

ccttacattt 

cccaagctgg 

agcaattctg 

tgactaattt 

aaactcttgg 

atgagccacc 

atcggtaaat 

gtgattttta 

tgctgcaagt 

gttactgtct 

ctaggagctt 

aaagttatgt 

ataccgtaaa' 

gaagtctaag 

aargtatgtt 

cttggcttgt 

tgtctgtcac 

taagtttgtc 

ataggacttc 

tccacttaag 

atctgatggc 

gattttccct 

gccaggctac 

ctggaattac 

ttgtttataa 

aagaagtgtt 

aatttgtctg 

gtagtttctg 

gccccctccc 

ttggccgggc 

gatcacctga 

ccaaaaataa 

aagctgaggc 

tgocactgca 

ggggggcatg 

tgcttgaggc 
aaaaataaaa 
tgaggtggga 
aatgcattcc 
ttttatggtt 
agaacatgtt 
gaggccaggt 
gatcacctga 
ctaaaaatac 
aggctgagac 
caccactgca 
aaaaatccag 
tgagaggctc 
atcagtacac 
ctgctatgaa 
aaggttgtat 
gcattggact 
gtttttgaag 
tgctttttcc 
ctcctggtta 
ccctccaaac 
cactggagtt 
tcacctccac 



ttactgagaa 
ttatttttat 
agtgcagtga 
ccacgtcagc 
ttgtattttt 
cctcaagtga 
acacctggcc 
atggttatct 
aaggctaaag 
ttaacttcaa 
aaatgttact 
atctattgta 
acatttgtgt 
ctggctggct 
atcagtcaaa 
gtgtgcctct 
agatgcatcc 
catgtccaaa 
atcagcaaca 
aacacgtttt 
cttcaagtaa 
ataaactgag 
gttttaattt 
tttcaaattc 
aagtgtgagc 
ttttgttttc 
cagtctagtt 
gtgtgcagaa 
tcaaacctta 
cctcccaatg 
acagtggccc 
gcccagaagt 
aaaatagagc 
gagaggatct 
ctccagcctg 
gtggctaact 
caggagttca 
aatttagctg 
ggatcacttg 
aacctgggcg 
gaaagtgttt 
acctgtaaaa 
gtggtggctc 
ggtcaggagt 
aaaaattagc 
acgagaattg 
ctccagcctg 
aggtgaatcc 
aaaggataat 
caagagcaga 
cagcatgttc 
aatgagcagt 
aaagtagcct 
tctgtttgct 
tgtcatggga 
atttgtactt 
tattccccgt 
gcaattcata 
tagaagatgg 



74160 
74220 
74280 
74340 
74400 
74460 
74520 
74580 
74640 
74700 
74760 
74820 
74880 
74940 
75000 
75060 
75120 
75180 
75240 
75300 
75360 
75420 
75480 
75540 
75600 
75660 
75720 
75780 
75840 
75900 
75960 
76020 
76080 
76140 
76200 
76260 
76320 
76380 
76440 
76500 
76560 
76620 
76680 
76740 
76800 
76860 
76920 
76980 
77040 
77100 
77160 
77220 
77280 
77340 
77400 
77460 
77520 
77580 
77640 
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tctccatgcg 
gtgagtaggt 
catagctcta 
aaccaggaag 
ttacagcaac 
tgcagtggcg 
gccttagcct 
gtattttagt 
tgtgatccgc 
ggcctacagc 
tgttttcaga 
atcttgaagt 
atcccagcac 
ggctgggcaa 
gtggcgtgtg 
tgggaggtgg 
agagtgagat 
attttgtcag 
taatttttac 
ttcaaatata 
attttagttg 
atattttacc 
gcagtggctc 
ttgagaccag 
actaaatact 
acatgcctgt 
ggcggaggtt 
aaactccatc 
tcatgatcta 
gtgttattaa 
tgttgtatta 
cataagtata 
tcaccaccca 
caccatcttt 
aaagctagca 
gtatttggct 
ttgtagttgt 
ttaacctgct 
ttacagtgtt 
tgctgctaga 
acctccacta 
aagtaaaatc 
ctcaatattc 
tttacttcct 
aagacagggt 
agcctcagcc 
ataggcacat 
gctcacacct 
gttcgagacc 
agcggggtgt 
ttgcttgaac 
attttttttt 
ctcaagtgat 
tgcctggtct 
gaaagtattg 
gacaaggtct 
aacctccaac 
acaggcatgc 
catgttggcc 



ggcagagact 

attgaataaa 

ttttattaat 

tgggaaacta 

cattctcttt 

tgatctcggc 

gctgagtagc 

agagacgggg 

ccgcatctac 

aaccattctc 

aacaacatag 

aagtttactt 

tttgggaggc 

catggcgaaa 

cctgtggtcc 

agtttgctgt 

cccatctcaa 

ttctatctaa 

atacttgatt 

taggaactta 

tctttctatg 

tcagatgtga 

acacctgtga 

cctgattaac 

aaatactaaa 

aatcccagct 

gcggtgagcc 

tcaaaaaaaa 

tcctgagaaa 

aatatctaga 

ttgtttaacc 

cagctgtata 

ggtcaagaaa 

atccactcac 

tgcctttgaa 

tctttcatca 

gcttttttac 

tatctattat 

ttttccacac 

tttaaatact 

gaagatggtc 

ttctgtaagt 

taaagtagtt" 

atgtgaaatt 

ctgttctgtc 

tcctgggctc 

gccaccatgc 

gtaatcccag 

agcctggcta 

ggtggcaggc 

ctgggaggca 

gtagtgacaa 

cctcccattt 

tcaagttgtt 

ttgtggaagt 

cactttttcg 

tctcaggttc 

gccaccacgc 

aggctggtct 



atcaccatgt 
tatttgtgga 
tagggaatta 
ggatttgagc 
tttttttttt 
tcactgcagc 
tgggactaca 
tttcaccatg 
ctcccaaagt 
ttttatccat 
cattcatgat 
ttaagaaagt 
caaggcaggt 
ccctgtctct 
cagccacttg 
gagccgagag 
aaaaagaaaa 
tacaattttt 
taacaaaact 
atgttatatc 
gtctcatgcc 
cctgactttg 
tcccagcact 
atggagaaac 
tctctactaa 
actcgggagg 
gagattgcgc 
aaagcagcag 
gcttttggga 
ttattttcca 
ttgtttattg 
cagctcagtg 
taaattgtta 
tcctctccct 
ctttatataa 
gcattgtatt 
acagatttaa 
taaaaaaaaa 
cgtcttcaaa 
agggaaaaaa 
tccatgtgga 
ttctttaaat 
aaaagtaact 
ttacaagtcg 
gcccaggctg 
aagtgatcct 
ccagctaatt 
cactttggga 
acatggtgaa 
gcctgtaatc 
gagattgcag 
ggtgtcactg 
cggcctccca 
attaaagcat 
taggagatag 
ccccaggccg 
aagcaattct 
ccggctaatt 
tgaactcccg 



gttcttcact 
gtaatcataa 
cagaattcag 
tccagtgagt 
ttttttttga 
ctctgcctcc 
ggcacccgcc 
ttggccagga 
gctggattat 
acttttttca 
cttaaccccc 
tgaggctagg 
ggatcacttg 
accagaaata 
ggagactgaa 
atcatgccac 
gaaaaagaaa 
tccttatgtc 
caatcttttt 
tgcttccctc 
agtttgtcag 
aagacttaaa 
ttgggaggcc 
cccatgtttc 
aaatacaaaa 
ctgaggcagg 
cattccactc 
cattgtgtaa 
ggaactgcat 
caaaaaatca 
aataactaac 
gattaccaca 
cctgtggccc 
caaaaccact 
atctaatgat 
tgtgagattt 
tttttatatt 
aaaacgaaca 
atgtaaagtt 
aaatcagaga 
cagtaatatt 
attttaataa 
ataaaatagt 
ttactctatt 
gagtacagtg 
cccaccttag 
ttaaaaaatt 
ggccgaggca 
accctgtctc 
ccacttactc 
tgagccgaga 
tgttgccagg 
aagtgctagg 
gtttacccac 
ggattctagc 
aagtgcagtt 
cccacgtcag 
tttgtagttt 
acctcaggtg 



tcaattttca 

tgaggtatag 

tgatctgctc 

gtggcctttc 

gatggagtct 

cgggttcaag 

acgacacttg 

tggtctcgat 

aggcgtaagc 

agagtactgt 

aattctgata 

tgtggtggct 

agctcaggag 

caaaaaatta 

gtgggaggat 

tgtactccag 

attgaaatgt 

taactgaaat 

ttttttttat 

cagtccccag 

tatgcctaga 

aaggaagcat 

gaggtgggca 

tctactaaat 

gatgagctgg 

agaatcactt 

cagcctgggc 

tattatgtag 

catagtcatg 

gttacatatg 

atgtagaaaa 

aagcgaatat 

taaaatccct 

agactactaa 

gtaggatttt 

atccagattg 

tttcttatat 

ttcacatagt 

tggtcttcaa 

agttaataat 

tctcttgtat 

atcatagtac 

acctgttttt 

tatttattga 

gcgtgatcat 

catcccaagt 

ctggggggcc 

ggcgaatcac 

tactaaaaat 

aggaggctga 

ctccatctca 

gctggtctca 

atcacaggca 

attatgcaca 

ctagcttttt 

gtgcgatctc 

cctcccgagt ' 

tagtagacac 

atccacccac 



gtagttggct 
atattattct 
aggatctcat 
attaaaaata 
tgctctggag 
tgatccccct 
gctaattttt 
ctcctgacct 
caccacaccc 
ttcatcttca 
ctgcctgaat 
catgcctgta 
ttcaagacca 
gtcgggcgtg 
ttcttgagct 
cctgggtggc 
ctagtctatc 
ctgctttttc 
gagacagcct 
aatagttact 
taagaactga 
tgtgccaggc 
ggtcaggagt 
acaaatctct 
gcattgtggc 
gagcccagga 
aacaaaagtg 
atgttgtgtc 
gacaacattt 
tatcttaaca 
gtatttatag 
actttcataa 
ccaggcactc 
catcatagac 
gtgtgtatgt 
ttgcaagtag 
gttcgaacag 
tcttaccagt 
tacatcagta 
attaactgtc 
tatctgtgct 
ttaaaatgtt 
ctgatcacat 
tttatttttt 
ggctcactgc 
agctgggact 
gaatgcggtg 
aaggtcagga 
acaaaaaatt 
ggcaggagag 
aaaaaaaaaa 
aacttctggg 
tgagtcactg 
tggtataatg 
atttttttgg 
ggctcactgc 
agctgggatt 
agggtttcac 
cttggcctcc 



77700 
77760 
77820 
77880 
77940 
78000 
78060 
78120 
78180 
78240 
78300 
78360 
78420 
78480 
78540 
78600 
78660 
78720 
78780 
78840 
78900 
78960 
79020 
79080 
79140 
79200 
79260 
79320 
79380 
79440 
79500 
79560 
79620 
79680 
79740 
79800 
79860 
79920 
79980 
80040 
80100 
80160 
80220 
80280 
80340 
80400 
80460 
80520 
80580 
80640 
80700 
80760 
80820 
80880 
8^0940 
81000 
81060 
81120 
81180 
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caaagtgctg ggattacagg catgagccac cgcacccggc ctctagcgta acttttacat 81240 

cctgaactga ccttaagaaa gtataacttt aggcctgttt catctgtaaa atgttaatgt 81300 

cataggagat gatcttttga gatttctttc agctctgata attttgtgtg tgtgtgtgtg 81360 

tgtgtgtgtg tgtgagatgg agtcttgctc tgtcgcccgg gctggagtgc agtggtacca 81420 

tctcggctca ctgcaagctc cacctcctgg gttcacgcca ttctcctgcc tcagcctccc 81480 

gagtagctgg gactacaggc gcctgccacc acgcctggct aattttttgt atttttagta 81540 

gagacgaggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc gtgatccgcc 81600 

cgcctcagcc tcccaaagtg ctgggattac aggtctgagc cgccgcgccc ggcctagaat 81660 

atttgtttcg attattctaa atctggtgac atttcttttg tttttaagtt aaatcttcag 81720 

taaaaagaat aaatgccacc tagaggacag aaaaattttt acagtagatt atcacagacc 81780 

tcatgactca ttactttggt gtataaaatg gcctttgtat ggtgtcagca cctgggaatg 81840 

tctcaagggg tgttcattga ccttctggac tatctggaaa tattttgata tttattggct 81900 

gggcgcggtg gctcatgcct gtaattccag cacctcggga ggccaagtta ggtggatcac 81960 

ttgaggtcag gagtttgaga tcagcctggc caactaagtt agttgactat ttgtgaaatt 82020 

tccctctcca aataggaaag ataggattgg aaacattatt cagaaggaag aagttttaaa 82080 

gaagggcagg cttaaagact atctaatgaa tttaccaata tggtaaaacc ccatctttac 82140 

taaaaataca aaaattagcc aggcgtggtg gtgggcgcct gtaatcccag ctacctggga 82200 

tgttgaggga tgagaatcac ttgaacccag gaggcaaaag tcacagtgag ccgagattgc 82260 

accactgcac tccagactgg gctatagagc aaaactctgt ctcaaaaaaa aaaaggaaaa 82320 

aaaaaaaaga aattttgata tttatgtgag aatgactttt cacggtgttc ttaatagcgc 82380 

aagttttgtt taggagagca cattccaact tacttgcttc tataaatata ccgtgtaatc 82440 

tagggcttaa agaatatgta caatgtcttt ttctctcccc tagtcttccc cttttctcac 82500 

tagttatatc cttgactgaa gagctatttc attctcaagt cttaggaatg cagggtgaag 82560 

caaaacagat gaatttttaa agcacttaac caggctgtat gaaatcacag tctgttgtct 82620 

aaaattgtaa gggacggtta gtagtactct cccctttctc aaaccaaatc tttggttgtt 82680 

ttaaggaagg gaaattaaat tcctgtgtgc tagattttca acataaaatt taaaaaactg 82740 

gaataatgtt gcattttatg tgtataacag tataatgctt tgttttaggt gggagaagga 82800 

gagaaattgg tgagggctct ttttgctgtg gctcgagaac ttcaaccttc tataattttt 82860 

ataggtaaga acatattttc caactaagtt attgactatt tgtgaaattt ccctctccaa 82920 

ataggaaaga tacgattgga aacattattc agaaggaaga agttttaaag aagggcaagc 82980 

ttaaagacta tctaatgaat ttagtaggac ccactatatt aataagtagt aaactagatt 83040 

aatctcagat gactcacata gcttggtctt taattaaagt cttatacttg tatttcctct 83100 

agatgaagtt gatagccttt tgtgtgaaag aagagaaggg gagcacgatg ctagtagacg 83160 

cctaaaaact gaatttctaa tagaatttga tggtgtaagt gttgattatg atatttttaa 83220 

tgtggcagca ttttagtata ttttcctatt aaatggccaa ggttaaaaat acaaatatct 83280 

ttatatttgt tattactttt ctaaatgaat tgaaaaaaga ttttttgctt gtaggtacag 83340 

tctgctggag atgacagagt acttgtaatg ggtgcaacta atciggccaca agagcttgat 834 00 

gaggctgttc tcaggtaggg agatttatat ggaaatacat gcatttatta cagacaatat 83460 

ttactcatgt gtccatctta catattattt ccttactctc agttttaaga ctaaattcac 83520 

tattttcttc cagtactatc tctagcctct tgttaccaac tacataagga ttttgaggtc 83580 

aacagcttga tatcaggaga attagtctag taaaggttta gttacggttt taggcaaatt 83640 

ggtcagttct tctgggttgc attaaattat ctttaaactt gaaaattgat tcttaccgtc 83700 

ttttattggg cttcatgaga aaataatcaa atcagggttc atggaaaatg tgttttctgt 83760 

tcttgtgtgt ttgagcagtt tattcccttc atactggaag gacggtttgg gtcagcataa 83820 

aattcttggg catcctttcc caaggaattt acaatattgc tccattgttt ctagattggc 83880 

tgtagtagtg taaaagtctg aatccaaatt gattttttca aatttgtaaa ataacttgat 83940 

ttttttctct ctttactgga tgggttacgt gggtatattg cacccaggta gtgagcatag 84000 

ggtgcagtag gtagtttttc aacccacacc tcactgcttt cttcccccat gtagtagtcc 84060 

gcagtgtgta ttgttcccat gtttatgtcc atgtgtactc aatttttagc tccccactta 84120 

tgagaacatg agctatttgg tttactgttc ccacattaat tggcgtagta ttaaggcctc 84180 

cacctccatc catgttgctg caaaggacat tatttcattc ttttttatgg ctgcgtagta 84240 

catagtattc catggtgtgt acgtaccaca ttttctttat ccagtccacc attgatggac 84300 

acttagattg attctatgtc tgctgtcatg aatagtacag caataaacat gaaatgcatg 84360 

tctttttggt ataatgatct attttccttt gggtatatac ccagtaatgg gatttcaggg 84420 

tcaaaggtag atttgtttta tgttttttga gaaatcttca aactgctttc tacaatgact 84480 

gaactttaca ttcctaccag cagtacatac gctccacaac ctcaccaaca tctgttattt 84540 

ttttactttt tcccgccaat ctgtagacaa tatgggattt tttttgccat tttattaata 84600 

gccattctga ctggtgtgag atatctcatt gtgattttga tttgcatttt tctgatggtt 84660 

agtgatgatg agcatttttt catgtttgtt gtcccctcgt atgtcttttg agaagtgtct 84720 
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attcatttcc tttttaccca ttttttaata 



ttgaattcct 

tgtttactct 

acttgtcaat 

gaggctgatg 

cttacattta 

tccagtttca 

gagtcctttt 

gtgtggcttt 

ccagaattat 

tacagctttg 

atatgaattt 

aaataccatt 

caggcaagag 

cttcactggc 

agaactgata 

gtaccatttc 

tttacaatag 

cccagcactt 

ctgaccaaca 

ggtgggcgcc 

ggaggcatag 

agcaagaatc 

cctaggaata 

tgctaaaata 

gaagaatcaa 

ctgttttctt 

aattttcttc 

cctgttgcct 

aactcttctt 

ttcatcttct 

cactgggctc 

gagtttgaga 

ttagctgggt 

tgaacccagg 

ggacagagca 

gtgggtcaca 

cagaccagcc 

aaaattaaat 

tttagtttgc 

ttattgtgtt 

ttttttttaa 

aaaaggagtt 

tcttgagtag 

cctacctaat 

actaaaaaat 

tataaagata 

gctatcaatt 

gagggactgg 

tctgacagtc 

gtaattttca 

agtttgttga 

agattcaaga 

tattaaaaac 

aacattaact 

tgcattccag 

ctttaaattc 

aacgggtata 

ttttagagca 



tatagattct 

gttgatggtt 

ttttattttt 

tcaagaagtg 

aatctttaat 

tttttctaca 

cctcattgct 

atttctcaat 

gctgtttggg 

ttctttttgc 

tagaatattt 

gaatctgtaa 

aaggaaacaa 

aatatgattc 

aatgatttta 

tatacgctaa 

ccacaaagaa 

tgggaggctg 

tggtgaaacc 

tgtaatccca. 

gttgcagtga 

cgtttccaaa 

cggctgatga 

aatcagaggt 

tatcgttaaa 

ttgcacataa 

ttcatccttt 

ttatttctta 

tccttggtgg 

gttttatttc 

ttgtttcata 

ccagcctggc 

gtggtcacac 

aggcagaggt 

aggctctgtc 

cctgtaatcc 

tcgccaacgt 

ttttaaaaaa 

tctatggcaa 

ttgtttgctc 

atgagccctg 

ttcttggaaa 

tccatgtata 

aatgaagtat 

attggtcact 

attcgtctta 

agggtttata 

ccttattacc 

atgtccatga 

ctgccctagg 

tgaagtgtat 

agacagatct 

atatacatac 

agagttttaa 

tgccttgaat 

aaaattatat 

tgtgtcttta 

gaaacaagaa 



ggatatcaga 

ctttttgctg 

gttgcaattg 

tatttcctag 

ccaccttgag 

tatggctagc 

tgtttttgtc 

tttctgtcct 

ctgctgtgta 

ttaggattgc 

ttttctaatt 

attgctttgg 

aaggcatcca 

tatactttga 

ccccaagatt 

taatgtccag 

aatgaaataa 

aggcaggtgg 

ccgtctctac 

tctgctcggg 

gccgagatcg 

attaaaaaaa 

aggaggtgaa 

gacacaaata 

atgggaaatt 

attatgtgtt 

taaactctta 

ctgggttagt 

ttttttattc 

tttgagcatc 

gaaaacaatt 

caacatagta 

acacctgtaa 

tgcagtgagc 

tcaaaaaaaa 

cagcactttg 

ggcaaaaccc 

ttaaattatt 

aatcttctca 

ttttttgggg 

tcctggtttt 

acctagtttt 

cactaaacta 

atgtgtatgt 

gcaagacatt 

gagtttcttt 

tggtctgcag 

ctttagggtg 

tctttagcgg 

cagttcacct 

gtttctgttt 

acttatatca 

ataaatgatt 

aagagtaaca 

attatatttt 

ttctaaaagt 

ccaaatgagg 

ctaccatctt 



gggttgtgtg 

ccattgttag 

tgcagaagct 

tgtttgggga 

ttttcttcta 

ttaatttttg 

cagtaatccc 

agtcttatca 

gttcctttgg 

gttcggttta 

tttgtctatt 

ttgtgaaaaa 

gcagtatagt 

aataggaaaa 

aaaccctaaa 

caggatacaa 

gctaagagtc 

tggctgggca 

atcacctgag 

taaaaataca 

aggctgaggc 

tgccactgca 

aaaaaagaaa 

agaatctgta 

aatggaaaaa 

tatcttaatt 

atgttgcgtc 

ggtctttttg 

atctaatctc 

attactttcc 

tgtatgttat 

ttttggcaag 

caaccctgtc 

tcccagctac 

caagacggcg 

aaagaaaaaa 

ggaggccaga 

catatctata 

ttatttcgtg 

tgcatgttct 

gcaggttttg 

tccttttttg 

ggaaggatat 

gcatgcagcc 

aaataagaga 

gtcttcccgc 

gttcattctc 

agccaggctt 

tgctatctct 

cagatccttt 

ttatgtattt 

ctattatcct 

gatattttgt 

aattctaaca 

aaaatatttt 

aaaagctttt 

gctggatttt 

aggtatgtat 

gacaatatta 



tttttagctt 

atgcagttct 

ctttagttta 

cttagccaaa 

gcatttttat 

tatatggtga 

catgccattt 

aagatcagat 

tttgtgtgtc 

aagtcaggta 

tggactcttt 

caacattgat 

cattttacga 

gaagtcatca 

aattccgtca 

aatcagtgta 

aaatcaagaa 

cagtggctca 

gtcaggagtt 

aaaaattagc 

aggagaattg 

ctgcagcctg 

aaaaaaaaga 

tgaggagaag 

cactccatgc 

tttttcccta 

cttttgtttt 

ttttgttctg 

ctttctgcta 

tgacatctgt 

ttccataagc 

gacagaccac 

tctgctaaaa 

tcaggaggct 

gcactgtact 

ttttttggtc 

tcacttgagg 

aaaaaaactt 

gaaagatact 

tcattttatc 

ttgttgttgt 

cttattattt 

tgtaggggaa 

tccctcactt 

tagggttgat 

cagactgtta 

accttccttg 

catatgcttg 

ttttgggagg 

gtgtgtcttc 

tagttccata 

tgctgatttt 

ttgttttaaa 

ataccgaatt 

tacattgata 

cctgtcattt 

tttttttagg 

ctgtgtttga 

agtcttccaa 



gttcaattgt 

gtagattgtc 

attaggtccc 

atttctttct 

actttgagat 

aaagtaaggg 

attgaatagg 

ggttataggt 

tgtttttata 

acgtgatact 

ttttgcttcc 

agtttgatag 

ccagataaat 

tactctcact 

aaaggctact 

caaaaaatta 

cacagtccca 

tgcctgtaat 

cgagaccagc 

caggcgtggt 

cttgaaccca 

ggtgtgaaag 

caatggagta 

tgtaaagcac 

tcatggattg 

gttcattttt 

ccctatctgt 

ttttcccaag 

tatcttttgt 

tattctactt 

tcttacattt 

ttgaggccag 

atacaaaaaa 

gataatcgct 

ctagcctggg 

aggcgtcatg 

ccgggaattc 

aaggataaaa 

tggtcataat 

tagtttatgt 

tttttttttt 

ttctttgaat 

gggataggta 

acagtgaagc 

ttattcttct 

gatgccttct 

ccattcctat 

tttaaatgtg 

aaaactgtac 

ctttgtcagt 

aatgttacct 

agtttttttc 

gcattactgc 

aaggatttta 

actaccaaaa 

gctgtttcag 

cgtttcatca 

attttttttg 

tccatggtac 



84780 

84840 

84900 

84960 

85020 

85080 

85140 

85200 

85260 

85320 

85380 

85440 

85500 

85560 

85620 

85680 

85740 

85800 

85860 

85920 

85980 

86040 

86100 

86160 

86220 

86280 

86340 

86400 

86460 

86520 

86580 

86640 

86700 

86760 

86820 

86880 

86940 

87000 

87060 

87120 

87180 

87240 

87300 

87360 

87420 

87480 

87540 

87600 

87660 

87720 

87780 

87840 

87900 

87960 

88020 

88080 

88140 

88200 

88260 



WO 01/18198 



PCT/FR00/02433 



28 

agctactttg gaaaacagtt tagtggtttc ttaaaaagat gtacataagc ttactgtcag 88320 

agccagcaat ttcactccta agaatttacc ccagagaaac aaaaatgtat gtccacacaa 88380 

agacttgtac aagaattttt atagcagcaa tattaataat agccagaact acaaatgatc 88440 

taaaatgttt attttggtga ataaacaaat gtggtatatt catttaatgg atactgttat 88500 

ccattataca tgctgcatac tcacttcata tattaagttt tatgaatgaa actccaaaac 88560 

attataagtg aaagaagcaa gatgatatat gtcgcatatc ataggattct gtttatatgc 88620 

agaaaacgca aatttatttt ttatttattt atttttttga gatggagtct tgctctgtcg 88680 

ctcaggctgg agtgcagtgg cgtgatctcg gctcactgca accttcacct cctgggttca 88740 

agtgattctc ctgcctcagc ctcctgagta gctgggactg caggcatgtg ccaccaggcc 88800 

tggctaattt tttgtgtttt tagtagagac gggtttcact gtgttagcca ggatggtgtg 88860 

atccgccctc ctcagcctcc caaagtgctg ggattacagg catgagtcac cgtgcccggc 88920 

cagaaatcga aaatttctag aaacgtaaag cagatcagtg ggttgtcagg gtgagagttg 88980 

ggaatgagga ttaactgcaa acaggtatga gtgaactaaa aagtgttcta aaactggatt 89040 

gtggtgatga ttgcacatct ataaatgtat taaaactcat tgaattatat acttacaatg 89100 

ggtgaaattc atagtagatg aattcatacc tctataaaac tggttttttg cagcaaaata 89160 

tttattgcta tgtttttatt caagtgtggt gaattattgc tatgttttta tccaggtgtg 89220 

gtgtctcacg cctataatcc caacactttg ggaggctgag gtgggaggat cgcttgagcc 89280 

aggaattcaa gaccagcctg ggcaacatag ggagaccctg tctctacaaa aactttttta 89340 

gaaattaacc aggcatggtg gcacgtgcct ttggtcccag ttactcggga ggctgagatg 89400 

ggaggattgc ttgaacccag gatatcgagg ctatagtgag ctatgattgt gccctgcact 89460 

ccagcctggg taacagcaca agaccctgtc tcaatataaa aaaagaaaag aatcattaat 89520 

tctgaaatta gactgaatga tcatttttta atatttttca gacaagacta cttttgctta 89580 

aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta 89640 

ggtgagtaat ttggatttgg tttatcttac agcttttatt tattttttgt aaataattct 89700 

ttttttagtt atttaaagta atcttaagta tgaaatgagt aattcattga tcagaagact 89760 

ttctctcatc ctctacctcc tttgcctttt tcttacctct tgttcttata ' tatatatgtg 89820 

gaatctaaat ttcactggct atgtcctttg caagacgtga tctaatgatg atagtatatt 89880 

ctttttataa atttattaaa acctgtaagt ggtattaaag taatttaaac atttacacct 89940 

taggcaacat ggtaaaaccc catctctaca aaaaataaaa tgagtcagga atggtggcac 90000 

atacctgtag tcccagctac ttgggaggtt gatgtgggag gatcgcttca gcccgggagg 90060 

tggaggttga gcaacagagt gagaccctgt ctcaaaaaaa attttaaaca tttcatattg 90120 

cacactaaca cagatatttt tatataaact tgttcttggc atatgctgaa tacttttcag 90180 

ctcttttaat aattttaatt atttgataat tttaataatt ttaatttcag ctatttgaat 90240 

aatcttaaac tttatgaaca gtgtgaagta gaaactgagt ataggagatg cgctcatgaa 90300 

ttttattccc tgaaaaatgt cataaagtaa tataaagtat tcaatgagta tgtgagtatt 90360 

gaataatttt aacaagaact ctgagttccc agatacctat gacaaaagaa caaattactt 90420 

ggaagtctct tctactccag acctttctgt ctatcccctt atttaaaaaa atgtacattg 90480 

attgtccctt atcccatcaa gagagtgttc tttgccaaga taaacgctaa ttagagaagt 90540 

aattgtgttt atgtgtcagt tggccaccag tagtttgtag atgttacctt tccaggtgac 90600 

atgtttacaa tttaatgaag cctctggaga tagtatgcct taatctaaag gaatggttct 90660 

aatgattaaa atttgaggca ttactacatt tgttttcagc aaatgggcct ttctattccc 90720 

ttaaaatcaa accctcataa ctatgggttt gctgacaaag ggaaactagt ttttactctt 90780 

attatatgga gattttaaat ctgcagagat gaaaataatt tgctgtttca gctgggtgcg 90840 

gtggctcatg cctgtaatct cactactttg ggaggctgtg gcgggtggat cacctgaggt 90900 

caggagttcg agaccagcct gaccaacatg gcgaaacgcc atctatacta aatacaaaaa 90960 

aaaaattagc caggtgcggt ggcgcatgcc tataatccca gctacctgag aggctgaggt 91020 

aggagaatcg ctccaggagg tggagatcac agtgagctga gatcatgcca ttgcactcca 91080 

gcctgggcaa caagagcaaa actccatctc aaaaaaaagc gggaggggaa ataatttgct 91140 

gtttcttcct tcccttcctc agaatgactg atggatactc aggaagtgac ctaacagctt 91200 

tggcaaaaga tgcagcactg ggtcctatcc gaggtaggta tacaagagct taaaacattt 91260 

agaactattt attataccac cttagaagtt taagaagtcc aaaaaaatct accaagagat 91320 

tttttttttc ttttggagac agggtctcac tctgttgccc aggctgtagt gcagtggcac 91380 

aatcatagtt cactgcagcc tcgaaccccc caggctcagg tgattctccc acccagcctt 91440 

cccagtagct gggactacag gcatgcacca tcatgcccag ataattattt tattttattt 91500 

cttgtagaga cagggtttca ccatgttgcc caagctggtc ttgaactccc gggctcaagt 91560 

gagcagcctg ccttggcctc ccaaagtgct gggattacag gcatgagcca ccatgcccag 91620 

ccttaaaacc attcttagct cacagatcat acaaaaacag tctatgagcc agtagactgt 91680 

gacccctgtt ctaggcaaga ggtttcattt cttgatagta agtaagcagc agaaaactca 91740 

aaaagaaaac tttaaacaaa aaagaataat gtaaggaaaa tgttcttatc tgttttctgg 91800 
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ctcttttcag 
aagttttcac 
tttttattca 
ttaggataaa 
tggttgatgc 
agctccatcc 
gttatcatag 
ttactagtta 
tgctactttg 
aaattttctt 
aatgcataaa 
tgggtttaaa 
acacctataa 
ttgagactag 
accaggcccg 
cacttgagcc 
agcctgggtg 
ggtggctcac 
aggagttcga 
attagccagg 
gtatcgcttg 
gagcaagact 
tgcagagtaa 
agttcccttt 
tccagttatt 
aaagttaaca 
atcattgtac 
tgcctgactt 
tgaggtatag 
gacatacata 
cagtctggca 
gcctcagcct 
ttagtagaga 
gatccaccca 
ctgttttgtt 
agactggagt 
cattctcctg 
ctaatttttt 
tctcctgatc 
gccactgcgc 
caggctggag 
cagtcctctt 
actaattttt 
actcttggcc 
tttaatggat 
atatggaaac 
aaagtcattt 
ggtgcggtgg 
tgaggtcagg 
tacaaaaaaa 
cgaggcgggc 
ctgtctccac 
cagctacttg 
gagccgagat 
aaaaaaaaaa 
gaggcaggag 
ttgcactcta 
aacttgtggg 
gttctatttt 



tattctgaca 
ttttttaatt 
ggttacttgg 
ctcacacaga 
tctcaggtat 
ctttctctca 
tgtctactgt 
aaaattacca 
caaaataaaa 
gctgctggag 
tgagttgtat 
aaaagattcg 
tcccagcact 
actgggcaac 
ttggcatgag 
tggaaggtgc 
ggtgacatag 
gcctgtaatc 
gaccagcttg 
cgtggttgtg 
aacctgggag 
ctgtctcaaa 
aaacaaaaaa 
caaatttgtg 
ccaaagaagg 
tgtgtctctt 
ttggttttgc 
ttatgtttta 
tattttacaa 
tatgaatgtg 
tgatatcggc 
cccaagtagc 
gggcatttca 
actcggcctc 
tgtttgtttg 
gcagtggtgc 
cctcagcctc 
gtacttttag 
tcgtgatctg 
ccggcctttt 
tgcagtggtg 
gtctcaaact 
taattttctg 
tcaagtaatc 
ttttctagtt 
ctatgaaata 
tctatcaaat 
ctcacgcctg 
agttcaagac 
ttaggccggg 
ggatcacgag 
taaaaaatac 
ggaggctgag 
cgtgccactg 
atagctgggc 
aatcacttga 
gcctgggcga 
ggtttataca 
gtttttcaat 



tcatttgaaa 
atatcttttg 
ttgattctga 
tattttcagc 
gcactcagat 
ttcaagaaag 
aatttgcatt 
gtaacacctc 
aatgtaatct 
cttaaatctt 
tttcttagaa 
catccattaa 
ttgggaggcc 
atagggagat 
cctgtaatcc 
aggcagcagt 
tgaggtgctg 
ccagcacttt 
gccaatatgg 
cgcacctgta 
gtgaggttgc 
aaaaaaaaaa 
agactaatgc 
aactattgtt 
aatattctct 
ttttttaata 
ccttcaacaa 
cagaactaaa 
tgatattttc 
tgtgtgtgtg 
tcactgcaac 
tacaggcatg 
ccatgttggc 
ccaaagtgct 
tttgtttgtt 
gatctcagct 
cctagtagct 
tagagacggg 
cctgcctcag 
tttttttttt 
caatcgtggc 
ttttagtagc 
tagagatggt 
ctcctgcctc 
gattagaagc 
gtcaaaattt 
catattacat 
taatcccagc 
cagcctggcc 
ggcggtggct 
gtcaggagat 
aaaaaaatta 
gcaggagaat 
cactccagcc 
atggtggcac 
acttgggagg 
cagagtgaga 
ataaaaataa 
aacctttatt 



ttaatgtgtc 
agggattgca 
aataccacga 
tacatttcca 
tattagctat 
tacaattgaa 
aaaagcctac 
ccgtagtgaa 
tgagagtata 
gttcagttag 
cgttttggct 
agtacagaaa 
aaggtgggag 
cctgtctcta 
cagctactcg 
gagccatggt 
tcttaaaaag 
gggaggccaa 
tgaaaccgca 
atcccagcta 
agtaagccga 
aaaaaaaaaa 
attttgtaaa 
tttgggcagt 
tctcagcatt 
taatgatttg 
tttcaactgc 
accagaacag 
tttgtcttct 
gttttttttt 
ctccacctcc 
taccaccaag 
cagtctggcc 
gggattacag 
tgtttgagac 
cactgcaagc 
gggactacag 
gtttcaccgt 
cctcccaaag 
tttttgagac 
tgactgtagc 
tgggactaca 
gtctctccct 
agtctctcag 
tagaaaaaat 
tttttggtaa 
aaataccaaa 
actttgggag 
aacatggtga 
cacacctgta 
cgagaccatg 
ccggggcgtg 
ggcgtgaacc 
tgggcgacag 
gtgcctgtgg 
cagaggttgc 
cccagtctca 
cctataacta 
tttttaatta 



taaaggaaat 
gcaaaatatt 
ccaattcttt 
cagccagcat 
gatgataaag 
tgtagttgta 
attatacaaa 
atagggtgct 
ttttgaaact 
tggatttaga 
attctaaggt 
atggccgggt 
gatcgtgtgg 
caaaaaaata 
ggagtctgaa 
catgccactc 
taaataaata 
gatgggtgga 
tctctactga 
ctcaggaggc 
gcactgcagc 
aaaaaagtaa 
gaacaagttg 
atgcaagaaa 
tataaattgt 
tactgaatag 
aaaatgtatg 
gtgaagaata 
atattgtaag 
tttttttttt 
tggattcaag 
cccagctaat 
tcagactcct 
gcttgagccg 
ggagtctcac 
tctgcctccc 
gcgcccacca 
gttagccagg 
tgctgggatt 
acagggtctt 
cttgacctct 
ggcaagtgcc 
gttgcccagg 
agtgcttggg 
taactttgct 
tagacaaaac 
cagaagaaaa 
gccgaggtgg 
aaccctgtct 
atcccagcac 
ctggctaaca 
gtggcgggca 
tgggaagtgg 
agcaagactc 
tcctggctac 
agtgagccaa 
aaaaaaaaaa 
tacgttaatc 
atttcttttt 



tctataagag 

tattgctatg 

ttaggttagg 

cggtagtgga 

taatcataat 

cgagaaagat 

cctttttgtt 

gattaagaac 

ctggatgaac 

aacagtagct 

agacaaaatt 

gcagtggctc 

gcctaatagt 

taataaatta 

gtaggaggat 

actgcactcc 

ggccaggcac 

tcatgaggtc 

aaatacaaaa 

tgaggcagga 

ctgggcaaca 

atacataaag 

cattctttta 

ttgaacactt 

atttgctctc 

atacatgtag 

tatttttaag 

tgtctgccag 

acatatataa 

ttttttgaga 

ctattctcct 

ttttgtattt 

gacctcaagt 

ctgcatctgg 

tctgtcgccc 

gggttcacgc 

ccacgcctgg 

atggtctctg 

acaggcgtga 

gctctgttct 

tggtctcaag 

acaacgcccc 

gtggtctcag 

actaattttt 

tcatttcaaa 

atatatacat 

ttacaggccg 

gcagatcact 

ctatcaaaaa 

tttgggaggc 

tggtgaaacc 

cctgtagtcc 

agcttgcagt 

catctcaaaa 

ttgggaagct 

gattgcccca 

aattacatga 

ctttaataat 

tttgagaagg 



91860 

91920 

91980 

92040 

92100 

92160 

92220 

92280 

92340 

92400 

92460 

92520 

92580 

92640 

92700 

92760 

92820 

92880 

92940 

93000 

93060 

93120 

93180 

93240 

93300 

93360 

93420 

93480 

93540 

93600 

93660 

93720 

93780 

93840 

93900 

93960 

94020 

94080 

94140 

94200 

94260 

94320 

94380 

94440 

94500 

94560 

94620 

94680 

94740 

94800 

94860 

94920 

94980 

95040 

95100 

95160 

95220 

95280 

95340 
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actctggctc tgtcacccag gctgcagtgc agtggcacca tcttggctca ctgcagcctc 95400 

cacctcccag gttcaagcga ttctcctgcc tcagcctcct gcgtagctga gattacaggc 95460 

atgggccacc acgcccagct aatttttttt ttttttgtat ttttagtaga gatggggttt 95520 

cactatgttg gccaggtggg tctcgaactc ctgacctcag gcgatcgcca gcctcggcct 95580 

ccctaagtgc aaggattaca ggcgtgagcc accatgcctg gccaatttat taccgtttct 95640 

taatatggaa gacctcctta tgagatgctg aagcatttca tttgaaaaaa gttgcatgta 95700 

aaatataaaa ttgggtatgc agaatggtca taactctgtg agcaaaattt tgaaatcagg 95760 

cttgaattac agtcagcctt ttctatccgt ggattctgca ttcatggatt caaccaactg 95820 

cagatcaaaa atacttgggg gaaaaaagca tctgtgttga acatgtacag acttttattc 95880 

ttgttattat tccctaaaca atatagtata aaaactattt acattgcatt tacattgtat 95940 

taggtgttat aagtaatcta gagatgattt aaagtataca ggaggattgt gtaggttgta . 96000 

tgcaaatact gcaccatttt acataaggga ctttaagcgt ttgcggattt tgctatctat 96060 

gggggaacca atttccgaga gatactgagg gacagctgta tatttgtaac ttatttttta 96120 

tttccctaat tgcagcagct gttgagggga cagtgaactg ttaacacaga taacaagtgt 96180 

attcaagtac attttggagt ttgtttgttt ttttttttca ggcttttatt cgcctgtcgg 96240 

atgaggcacc atacttgaat tttttttttt aagaaagctt ttagttttct ttctttcttt 96300 

tttttttttt gtgagatgga gtcttgctct gtttctaggc tggagtggag tgcagtggtg 96360 

tgatctcagc tcactgcaac ctccgcctac tgggttcaag tgattctcct gcctcagcct 96420 

cccgagtagc tgggactaca ggtgcacgcc accacgccca gctaattttt tttttttttt 96480 

tttttttttg tatttgtagt agagacagag tttcaccatg ttggccagga tggtctcgat 96540 

ctcctgacct tgggatccgc ccaccttggc ctcccaaagt gctagggatt acaggcatga 96600 

gccaccacgc ccggctgaaa gcttttagtt ttctaactta tttaatttaa tttaatttaa 96660 

tttattttta ttttattttt tgggacagtg tctcacttgg ttgcccaggc tggagtgcag 96720 

tggtacaatc atggctcact gcaccctcta gctcctgggc tcaggcaatc ctcctgcctc 96780 

agccttttga gttgctggga ctacgggcat gtaccaccac actcagctaa atttttaatt 96840 

ttttgtagag atggggtctc actatgttgc ctaggctggt ctcagattcc tcaagcattc 96900 

ctcccacttg cacctcccaa aatgctggga ttacaggtgt gacaccgtgc cagacttgaa 96960 

atttttaatc ccacacctaa aaatataatt ttatccacca ttttttaaaa gtcataacat 97020 

tatttattaa aaatttagat ggtaaaacta aaaattaaag cttaataaaa ctactgagtg 97080 

atttacaagg aagaatatta ctggtccctt ttgtgagcat cccattaatt atatatattc 97140 

aggttatatt gttacaatat ttggttctac tgtatacttt tttttttgag actgagtttc 97200 

gctgttgttg cccaggctgg agtgcaatgg tgcaatctcg gctcactgca acctccgcct 97260 

cctgggttca agtgattctc ctgcctcagc ctcctgagta gctgggatta caggcatgcg 97320 

ccactatgcc tggctaattt tgtgtttttg tagagacggg gtttcactat' gttggtcagg 97380 

ctgatctgga actcccaacc tcaggagatc cgcccacctc ggcctcccaa agtgctggga 97440 

ttgcaggtgt gagccaccat gcctggctct actatatact ttcattcagt tgtttctttt 97500 

taatctagtg gttttggtat taataatttg ataatgacct ttagctgtta ttgcttactt 97560 

atgagttaat atttataaag cacttaaagt agctggcacg tagtaaacac tatgtaaaga 97620 

tccattaaat aactttaaaa aatataaaac tgatagtggc attttattat agagattaag 97680 

gtaatccatt ctctcatttc catttatggg atgagacgta aacacaagta gtttgctctc 97740 

taaaactgta tactagaatt ttatataccc attatttgat gcaactttaa taccaaagtg 97800 

tattgtcagt taccggtgaa tatatataaa tttaggtaag gaaaacccaa cttggtcgca 97860 

cacagtggct cacgcctgta atcctaccac tttgggaggc cgaggcagtt ggatcacctg 97920 

aggtcttgag ttcgagacca gcctggccaa cgtggcgaaa ccccgtctcc actaaaaata 97980 

caaaaattag ccgggcgtgg tggcacatgc ctgtaatccc agctgctcgg gaggctgagg 98040 

aaggagaatt gcttgaacct ggggaggtgg aggttgcagt gagctgagat cgtaccactg 98100 

cactccagtc tgtgcgacag gagcgagact ccatctccaa aaaaaaaaaa aagaaaaacc 98160 

caacttatct tttacagttt ataatagtag aagttcaaat aattggtttg gaatttctgt 98220 

atttttaagg ttagtactaa aattgttggt tataaattgg ggtacaatat actttgtttt 98280 

ttaagtacct tgtgtatcta atttaacttt aagtccttta ttattttggt ttgataagac 98340 

aacttttcta cttatttccc cccttaactg aaccagctac catctgcctt tttcctgttg 98400 

tatacattag tctcttacgt taaaatatca tataagtttc atatatatac acatatcaaa 98460 

ctatagactt aaagtacaat tacatcaaca tcttttaaaa ccttaatttc tggccaggcg 98520 

tggttgttca tgcctataat cccagcactt tgggaggctc aggccattgg atcccttgag 98580 

ctcaggaatt cgagaccagc ctggataaca tggtgaaatc ctcatctcta caaaaattac 98640 

aaaaagttag ctgggcgtgg tggcgcacac ctatagtcct agctacttgg gaggatctct 98700 

taagcctggg aggcagaggt tgcagtgagc cgagatcatg ccactgcact ccagcctggg 98760 

taacagtgag accctgtctc aaaacaaaaa tattaatttc tataacaaat aaattttatt 98820 

tagtaatatc atgtttaata cccatgttac attcattatt cttctacact ttggccttta 98880 
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ggaagaggca 
atggggtttt 
tatcactctg 
cctcc cagac 
gcgccaccat 
-cagqctggt 
ggqnttaac 
t -tggctaa 
: -aaag 
ccagt 
.tatac 
- tttt 
?gcc. 

.. ;;.jg^c 

u'Ctttt 
_tactt 
. ^ggcaa 
gggcaa 
.;tgagg 
. . :acaa 
^ .jacag 
cngtgattct 
tgtttttata 
agtaataaat 
aaatatattt 
cattaagaaa 
ttgatcattt 
gacttcactg 
tacatacgtt 
ctgcagaaca 
agaaacagcc 
agatgaacca 
taaggccttg 
acctgattct 
gttgcagatg 
tttgtcttct 
gtcttaacta 
tataaattca 
attttgagag 
ccttttattt 
agcaaatatg 
agatcagtct 
tgtagactgt 
aagagagcca 
gaactaagac 
gcaagtggaa 
aaaaactgaa 
ctcaaaagtt 
ttccatttgt 
agagactcat 
gtttactggt 
aaatgtcatg 
tttcttaggt 
ttataatgaa 
aatatagaag 
gttgcccagg 
ttcaagcaat 



gtgtgtgtgt 
ctttggtggg 
tctcccaggc 
tcaagtgatc 
gcctagctaa 
ctctaactcc 
aggtgcgagc 
aatttttcag 
atgatatgaa 
tgttggagtt 
q-tagaaatg 
-ttttttt 
„atctcggc 
tcctgagtag 
ggggtttcac 
cttgy cctcc 
attaattttt 
aggtgtaaat 
tttaaaagat 
agtggctcac 
ttaggagttc 
aaattagctg 
aagaattgct 
ttttttctct 
ttggaaaaat 
atattagtat 
aaatggctga 
cagcagcatc 
gtattgtcat 
aatccttgaa 
ggaacaagga 
ttttacttaa 
taagtttaca 
gaaaacagac 
ccttgatggt 
ggtcttcttt 
aaagtattcc 
gatgtttttt 
caggtgattg 
gtgtgccaaa 
tttcttcttc 
ttctattacc 
gtaaaataga 
tcatgtgacc 
taacttcttc 
attttaactg 
atttctaatt 
ctaccatctt 
tttttataca 
ctagttctag 
ttgtataaat 
atcatggcct 
taaaagtttg 
agtggaaaga 
tttgaaagaa 
gacatacatt 
atgcatgatt 
ctggagtgca 
tctcctgcct 



tacagttaaa 

gggttgctgg 

tgaaatacat 

ctcccacctc 

attttgtaca 

tgggctcaag 

cactgcagcc 

attagtttac 

gttagattgg 

ttgtttaaag 

atttttaaca 

tttttttgag 

tcacttacaa 

ctgggattac 

catgttggcc 

caaagtgcgg 

ctattgcctg 

atagatattc 

cagaaaataa 

gtctgtaatc 

aggaccaacc 

ggcatggagg 

tgaaccttgg 

ttgtctgtat 

attatgcttt 

agcatttatt 

cataattttc 

attactttaa 

gtgcttttta 

aaaaataaaa 

ctttggagat- 

aagaggaaac 

ggacttttta 

ttaaacaaaa 

cacagttatc 

accaatataa 

aggaacagtg 

cttaaaatag 

gaatgccaaa 

tgaaactttt 

ataaatctac 

ttgctaccaa 

gaaggtttga 

tgcagtattt 

ctgatggaat 

ctgtgaaaat 

tattgcttat 

ttattcttaa 

tggcatacat 

tctgttgatc 

atgcctggat 

tttaaatatt 

tttacagaac 

atatttgtag 

tacattaaaa 

cttcttaatt 

tctgggtttt 

atggcgcaat 

cagcctcccg 
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taggaaacaa 

gtttttgggg 

tggcatgctc 

agcttcccta 

ttttgtagag 

tgatccactt 

agcctatatt 

aagttacaag 

gtttttaaga 

ttctttaact 

caggtcattt 

agggagtctc 

cctccacctc 

aggcacctgc 

aggctggtct 

ggattacagg 

gactctgtga 

attaactcag 

gaccaaatta 

ccagcacttt 

tggccatcat 

catgtgcctg 

agggggaggt 

ttttgaactt 

caaatgttaa 

aaggtttctt 

taagaataca 

tccatcattt 

aaaatctaga 

cgcagcgtca 

accactgttt 

acaagatctt 

gagtcttaca 

tatacaatgc 

ccaatggaca 

tcataatgta 

aatggtagaa 

taatttctcc 

cactcttaag 

ttcctaagta 

agacattaaa 

acagtttaga 

aggtttgagt 

ttttttctaa 

ttattttctg 

gtttccagtg 

tactttctta 

taattattaa 

ttttctagtt 

tgccttttgt 

tttcattata 

gtaataaagg 

ttttctctgg 

tagtaacaag 

taaaaaactt 

ttactcttgc 

tttttttttt 

ctcgactcac 

agtagctggg 



gtagggttca 

tttttttttt 

atggctcact 

gtagctgaga 

atgaggcttt 

gcttcagcct 

ttaactatat 

tgtaggtgat 

gtagttttta 

tcttattttt 

atgccaaact 

actcattgcc 

ccaggttcaa 

ctggctaatt 

cgaactgctg 

tgtgagccac 

acctatccat 

cattgtttta 

atataaaaat 

gggaggccaa 

ggcgaaaccc 

taatcccagc 

tgcatatctg 

ttctataaat 

tacctatgaa 

gtgtagcaga 

tacacgtata 

cgttaaccac 

tgagaaatat 

gccctcaaac 

aaggaaatac 

caatgaacgt 

tatttgtgca 

aaatgtaatt 

ctaagttaga 

aataataatt 

gacacaagaa 

tacttttctt 

tttattttct 

actgtaatag 

caattgttgt 

tagcaatata 

tactctgtca 

tgtatttgtc 

caagaattat 

caagagaagg 

attttacagg 

tcccttcaat 

ccttctgctt 

tctcccaaaa 

aaaatgtcat 

caaatagata 

tgcttaaatg 

aatttttcat 

gcccctacta 

tcttgttaaa 

tgagacagag 

cacaacctcc 

attacaggca 



tatagtgctt 
tgagacaggg 
gcagcctcaa 
ctacaggcgt 
gccatgttgc 
cccaaagttc 
gtttttttct 
atctcatgga 
aaatacggat 
gggccaaaat 
gcattttgcc 
caagctggag 
gcgattctcc 
tttgtatttt 
acctcaggtg 
cgtgcttggc 
tttgcctttt 
atctatattt 
gcatacttta 
ggtgggcgga 
tgtctctact 
tactcgggag 
agtggtgaaa 
gattgtgttt 
actaaacaca 
tcaacataga 
ttttttataa 
catatacctg 
tcgattatct 
tttagaagcg 
ctttgtaaac 
catcggctac 
ccaaacttga 
ttttgttgtt 
gcacaacaaa 
tgtatattgt 
catttgtttg 
ttctactgtt 
tttttcgttt 
gaaaaagttt 
gttcttttta 
atagcaaaaa 
tataacatgt 
agaaatctgt 
tctgatattt 
gaaatactag 
ataattataa 
gaaactttaa 
gctttattaa 
tgtacagtaa 
tgtagggagt 
tttgccctta 
atgctatgta 
ttaggaaaga 
ggtaagaact 
gatttgtttg 
tttcgctctt 
gcctcccagg 
tgcgccacta 



98940 
99000 
99060 
99120 
99180 
99240 
99300 
99360 
99420 
99480 
99540 
99600 
99660 
99720 
99780 
99840 
99900 
99960 
100020 
100080 
100140 
100200 
100260 
100320 
100380 
100440 
100500 
100560 
100620 
100680 
100740 
100800 
100860 
100920 
100980 
101040 
101100 
101160 
101220 
101280 
101340 
101400 
101460 
101520 
101580 
101640 
101700 
101760 
101820 
101880 
101940 
102000 
102060 
102120 
102180 
102240 
102300 
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ccccagctaa 
ttgaactcct 
gcataagcca 
agccataagg 
atgagagttg 
taggtgatgg 
gataacgaaa 
gacatttcag 
tacttggata 
tattgtctcc 
aagatttcaa 
gaaaatcatt 
gagaactatt 
gaagggccat 
tcaataaaga 
ttagattcgg 
agcattagtg 
tgatatattg 
ggtaaaagct 
tatgtttgta 
atatacagcc 
ttttggtaaa 
taaatgcttg 
aagggtacag 
ttattttgtc 
taatgaagga 
agaaagcaat 
ctataatgga 
gggagaatcg 
ttctgccaaa 
tacacctgta 
gaggaggttg 
tgtctcaaaa 
tttccagttt 
ggctgaggaa 
ggagagtgcc 
tggattccaa 
ttaaagtcta 
aagttccact 
cacgccttaa 
caaaatggaa 
atccattagt 
tcatcacagc 
aaattatgtg 
tactcaacag 
aatagcgtta 
agtttcagca 
ccgtaatcac 
gaccagcctg 
atgggtgatg 
aacctgggag 
agaagagcaa 
cgcctgtaat 
agaccatcct 
ggcatggtgg 
tgaccccagg 
caaccgtctc 
aagtcttgta 
gtaaactagg 



ttttgtattt 
gacctcaggt 
ctgcgcccag 
taaatcatgt 
agataaatag 
gtagtatccc 
ggtagtaatg 
ttaagctcat 
actggctaat 
tttaaaacta 
atgttaaaag 
actgtataga 
ttctatgact 
gaaaatagag 
tagaagttgc 
tgttgagctc 
tgctcttcat 
gactttgagc 
tattctaaga 
ctccagaaga 
gtctttgttt 
atgaaccatt 
tctcaatttt 
ttgcataaag 
tttacttttt 
gttgtgtgta 
gattgggtgg 
agagattcag 
cttacactca 
aaaaaaaaaa 
gtcccggtta 
cagtgagcca 
aataaaaagt 
gtgcagttca 
tcatttggga 
tcagaaagta 
aattgtgctg 
aaaaactcag 
aagaaggact 
ggaagaatga 
ataaacttac 
aatttaaaac 
atatatccaa 
atccttttga 
aaaatataca 
aaatatgtta 
gaaaaataag 
agcactttgg 
accaacatgg 
catgcccata 
gtagaggttg 
aactccatct 
cccagcactt 
ggctaacatg 
cgggcacctg 
aggcggaact 
aaaaataata 
atgaaaacta 
cacaacagga 



ttagtagaga 
gatccgcctg 
ccagaagatg 
ctcttccaat 
gggaaaaaaa 
tttaaggtct 
aaatatatat 
aaaatttcat 
catattaaag 
tcatggttat 
agataaaagt 
agttgctttc 
taactctaac 
taatgatata 
tgaagttttc 
tgtgttgtat 
gttaatatgg 
caagggaaag 
cagtctgtcc 
attagaggaa 
atagtgtaga 
tacagttcgg 
agtctggtct 
tgggttttta 
tactttaaaa 
ttggactctt 
ctctgcagag 
gctgggtgtg 
ggaattcaag 
aaaaaaaaac 
ctcaagaggc 
agatcacacc 
aaacgagatt 
cttggatata 
cttctagaac 
agctctaaaa 
gtgcagtgtg 
cagcgattgc 
gagtaaatac 
cagcatccta 
tgtaatgaag 
cagaacaaaa 
agctcagtac 
ctcaacttcc 
gaagcagatg 
aaagaattta 
aattgaaaac 
gaggccaagg 
tgaaacccgg 
atcctagcta 
cagtgaacca 
caaaaaataa 
tgggaggccg 
gtgaaacccc 
tagtcccagc 
tgcaatgagc 
ataataataa 
cagtatctga 
aagactgaaa 



tggggtttct 
cctcggcctc 
catgatttct 
catgactttg 
atttttttca 
caaacattac 
gatgaaaaga 
tgttttcatt 
gactatgtgg 
aattctattg 
caggttaata 
ctgatcaagt 
caagttttat 
gtaggagata 
tgaattaata 
tacttcctaa 
cagagttttg 
aatgagtact 
attgagaata 
aagcagatac 
attctttata 
ttttggactc 
tttgtacttt 
tcctaatgta 
ctttttgata 
agtaacaatt 
caatcaaaac 
gtggctcatg 
accagcctgg 
taaactaaaa 
tgaggttaga 
accacactcc 
caccttaacc 
gaattcaggt 
acctgaaaat 
tctgcctaca 
attatttaaa 
agctgcccaa 
ttggtgtttc 
gaactaaagg 
cttaaaatca 
cacagcattc 
ataataaaca 
ctgatggaaa 
cacaagtgac 
caagaagaga 
ccaacagagg 
caggtggatc 
tctctactaa 
cttgggaggc 
agatcatgcc 
taataataat 
agacaggcag 
gtctctacta 
tactcgggag 
ccagatcgcg 
ttagaaaata 
aattaaaaat 
aagacaagta 



ccatgttggt 
ccaaagtgct 
taggatcata 
gaactccctg 
agccagagct 
aacatcaatt 
attgagaagt 
taaaagatta 
ttccagctca 
ggaaagactt 
ctatcttaaa 
ctgaacttca 
tttaagctgt 
agggattggt 
atgacttaga 
aagataatgc 
taaactaaat 
atctttccag 
ttagatttct 
tagaattcta 
ttttgtacaa 
tgagtcaaag 
tcttcagaag 
ttggaaataa 
ttttaggggt 
ataaacgctt 
aaggtagaaa 
cctgtttggg 
ggaatatagg 
attagccagg 
ggatcgctta 
agcccaggtt 
agcttttacc 
agaatgtgac 
tagaagagaa 
tattcctttc 
ggaacccagg 
ggacagagag 
ccattgaacc 
ctgtgcttca 
aatctcacag 
ttigagaagaa 
gttactaagc 
aaaaaaagtg 
ctctatgaga 
taatgggtga 
ccaggcaccg 
acctaaggtc 
aaatacaaaa 
tgaagcagga 
attgcactcc 
tggctgggcg 
atcacaaggt 
aaaatacaaa 
gctgaagcag 
ccactgcact 
ataaaaaata 
ttaaatggat 
agtatcaaac 



caggctggtc 
gggattacag 
tgctgtttgt 
aataataaaa 
atgcatatgt 
atgaaatact 
tctaaattaa 
acgttattga 
acttttaata 
ttagataaca 
cactgagtca 
gctagtgcta 
ttctttgata 
ttggtctttt 
ttgtgacctt 
ttaaacatta 
taaaacttac 
atatcttaag 
gacttgcaaa 
atttaattac 
aaactaattc 
gattttcctt 
aaatgaatta 
atgataaact 
tggagtctga 
aacaaaatat 
ctgcaaagtc 
aggccagtat 
gagaccctgt 
tttggtggcc 
agcccgggag 
acagagaacc 
catagggcaa 
agttttgaca 
attttgggaa 
aaatccttgg 
agaaagcaag 
tttgaaattc 
cccaaaatgc 
gcactaagga 
catcaaggtt 
aacaattcag 
atgcaaagaa 
gtccatacca 
gtgattttaa 
atagataggg 
tgcctcacgc 
aggagttcaa 
ctagccgggc 
gaattgcttg 
agcctgggca 
cggtggctca 
caggagattg 
aaattagcct 
gagaatggca 
ccagcctggg 
acccactgga 
ggacttaaca 
caaagcagag 
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agagaaagaa aaaagaaata gcagaggttt gagacctttg gaacattatc agttcctgta 106020 

atttgaagta aagaaggaaa ggaagagaat ggggcaagag aaatctttga agcaatgatg 106080 

cgtgaaattt tccccaaagt gttgaaagac atcaacgtac agatctaaga agttcactga 106140 

atccccaagc agaataaata caacaaagac tacatctggg tacatcacat tgccaaaaaa 106200 

aaaaaaaaaa aaaatcttaa aagcaatcaa ggtggggagt gggaaggagt agcattacat 106260 

tcagataaac aagagtgatg gctaacctca tcagaaatga tggaattaag aaaatgatgg 106320 

aatgacatct ttaaggtgca aagatgaaac aaaggttaac ttaaaactct gtatccagtt 106380 

aaaatatcct tcaagatgtt aaggcaatgg ccaggctcag tggcttatgc ctgtaatccc 106440 

aacactttgg ggggctgaga caggagaatc ccttgaggcc atgagtgacc agcctgggca 106500 

acctagtgag aaccccatca aaaaataaaa ttagctgggc atgggctgtg gtcgtgctac 106560 

tgcactccag cctgggggac agagtcccta tctcttgaaa aacttaagac aaaatctttt 106620 

ccagatgaaa acagaatttg ttgctggcag actgacttta tacggaatgc tttaagaaat 106680 

tcttcaggct gaaggaaaat ataaatctgg agtgaaaaac gtagtatctg aaattaaaat 106740 

tttccttgga tggacttatc agtaaatgga tttcccaatg ggaacctgta tctccaggat 106800 

ggaattaaga attttgaaat gataaacatg ttggtaaata agaaagacat ttttcttttt 106860 

tatttttcta aatatcattg ctgtttaaag caaacaaaaa tagtattgca gtgtttataa 106920 

tatatgtata agtaaaatat aggacagaaa tagcatgaag ggtcagagag ggcaataaat 106980 

gtaattatat tgagataata ttactatatt gtacacaaag tgagatagca ttagtgtaag 10704 0 

gtagattgtg ataagaatgc attttgtaat ctctcacccc atcactgggg tgcagtagat 107100 

ctaaaaagcc attagagaag ataaaatggg tcactaagaa ttatgtgatt agtcaaatga 107160 

aatcaaggaa agaaaaacag agcaaagaag tgtaagataa aacagtggga tggaagagct 107220 

gaaattaata atgtcactaa attgcttacc ttcctccttc ctgaactgtt gtggattttt 107280 

tttttttcag ggggttgagg ttttttttta gagacagagt ctctattgcc ccaggctgga 107340 

cagcagtggc gtaatcagtc . tcaaaatccc tgcagtctca aactcctggg ctcaagtgat 107400 

cctcctgcct cggcctccca aaatgctggg attacaggca ggcagagcca ccacaccctg 107460 

ccagaactat tgttttaaag tcattaggtg gttaagccct cgagactatg tgcaagtttg 107520 

atgattcgtt aggagcactc acaggactca gcatatagtc ttattcccaa caatgattta 107580 

ttagagcaaa aggatatgaa gcaaattcag caaagggaaa aaaggaatta agtgaagtcc 107640 

agaggaaacc aagcaccagc ttctaagggt tctctcctaa tgaagtcaca caggatgtca 107700 

ctccagcaac aagtgacagc atgtgaaagt gttaagcctc actgttagac atagtaagct 107760 

tgttagggaa tagagggaat ctcccctcaa attcaagttc ccagatgcct ggcaagggcc 107820 

aaccttgcca gcaggacttt ctggggatag cagtcccagg cacgtgtttg cacagtggtt 107880 

cagatcaatg tgcttacatt gggtagaggg gacctatgga agtccaaatt tgggtgtcag 107940 

agacctaata gggtgaagac agtgtctaca atgatggaca gctaggtatg aggtgtcagg 108000 

gacagattga ggcagttatt cacatggtgg ataggggcaa cctggaatga ggaataagct 108060 

caagcacaga aaggggtgtc catatggggt aagggtgtca gcagagatgg tagattggtt 108120 

gcacaccaaa gacttgatgg aataaagtga atatactaac cacagagaag gtaattataa 108180 

atacagaaag gggggaaact agaatgaaac ctggagttca gcttgaattg ggtttaagaa 108240 

agtgaattca tggtttaaaa tctataaaaa tagatgaaat atcggctggg cacagtggct 108300 

cacgcatata atcccagcac tttgggaggc cgaggcgggc agatcgcttg agatcaggag 108360 

tttgagacca gcctggccaa cactgcgaaa ccccatctct agtaaaaata caaaaattag 108420 

ccaggtgtgg tggtacacac ctgtagtccc agctacttgg gaggctgagg cacgagaatc 108480 

acttgaacct gggaggcaga ggttgcagtg ggctgagatc gcaccactgc actccagcct 108540 

gggcaacaga gcgagatcct gcctcaaata aaaatagagg acotataagc atataaatat 108600 

acacgtgtgt atgtgtccaa atatgtatat tccctagtct gtccaccaag gtggccttgg 108660 

agcagttatg ctccaataat aatgagcaca taaagtaccc atatcttgcc ttccaaattc 108720 

ttcactgtct tagtctgctt gggctgcatt acaaaatacc atagactggg cagcttaaat 108780 

aacagaaatt tatcctcaca gttctagaag cttggaagtc caagattaaa gtaccagcca 108840 

gtttggtttc tagtgagggc tttcttcctg gcttgcagat ggccaccttc tcaccgtgtc 108900 

cttgtatggc agacagcaca agctctctgg tgtccctttt taaaagggca ttaatcccat 108960 

catgacagtc ccatcctcat tatctcatct aaccctaggt acttcccaaa ggctgaatca 109020 

ccaaagacca tcacattgct ggtgaaggct tcaacatatg aatttgaggg acacgaatat 109080 

tcagtccata acatcaacta aaggaaccaa gactctttga taaaatggct aaattcaggg 109140 

ctggggcaga gaaaatacat gagtgtggaa cttcttgtgc cagagagaaa aagtgcccaa 109200 

agattgatga ggatgaatca ttgaaatgac acacagatta aaagggttcc cactggacaa 109260 

atttgagcat caaaataagt aatagtagta attaattata acccatcaga agaaataaac 109320 

catgagctca tgtgaatata tgaatacaaa cataaacaaa ttacaagcat aatgaggaat 109380 

gtgatattta tatggtttaa aggtacctct ccaggccggg tgcagtaact ctcacctgta 109440 

atcccagcac tttgggaggc caaggcaggt agatcacctg aggtcaggca tttgagacca 109500 
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gcctgcacaa catggtgaaa ccctgactct actaaaaata cataacgcga gccgggcgtg 109560 

gtggcacgtg tctataatct gccactgatt aggtgtgtga ttttcccaag caggggataa 109620 

tagtagtacc tatgtcaaag gctgttatga ggattaaatg agctaacaca taatcgtgct 109680 

tttttttttt tttttttttt ttgagacaga gtcttgcact gtcgcctggg ctggagtgca 109740 

atggcacgat ctcggcccac tgcaacctct gcctcccagg ttcaagtgat tctcctgcct 109800 

cagcctcctg agtagctggg attacaggct cctgccacca cacctggcta ttttcaatag 109860 

agacggggtt tcactatgtt ggccaggcta gtctcaaaaa cctgacctcg tgatccaccc 109920 

gctttggcct cccaaagtgc tgggattaca ggcatgagcc actgcacccg gctttttttt 109980 

tttttttttg agatggaatc 110000 



<210> 2 

<211> 3263 

<212> DNA 

<213> Homo sapiens 



<400> 



tggctgccgc 


60 


cagtgagagc 


120 


gccagcaacc 


180 


gccgggccgg 


240 


ccgctgtttg 


300 


gtgtggctct 


360 


gcgccagcac 


420 


gtccgagtct 


480 


gatgagaaag 


540 


ctggaaaaag 


600 


cgccttcaag 


660 


gagaagatgc 


720 


actaacttgg 


780 


aaagacccct 


840 


ggatctgcag 


900 


tctggagtga 


960 


aataggacaa 


1020 


aattttagga 


1080 


ggaacagctg 


1140 


gaaattgtta 


1200 


agagggctgt 


1260 


gctgcagaat 


1320 


gtgggagaag 


1380 


tctataattt 


1440 


gatgctagta 


1500 


ggagatgaca 


1560 


gttctcaggc 


1620 


cttttgctta 


1680 


caacttgcta 


1740 


gcagcactgg 


1800 


gagatgagaa 


1860 


gtcagccctc 


1920 


gtttaaggaa 


1980 


tcttcaatga 


2040 


tacatatttg 


2100 


atgcaaatgt 


2160 


gacactaagt 


2220 


tgtaaataat 


2280 


agaagacaca 


2340 


ctcctacttt 


2400 


taagtttatt 


2460 


agtaactgta 


2520 


taaacaattg 


2580 
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ttgtgttctt 
tataatagca 
gtcatataac 
tgtcagaaat 
ttattctgat 
aagggaaata 
caggataatt 
caatgaaact 
gcttgcttta 
aaaatgtaca 
tcattgtagg 
gatatttgcc 



tttacctttt 
aaaaagcaaa 
atgtagatca 
ctgttgtaga 
atttaagaga 
ctaggaacta 
ataagcaagt 
ttaaaaaaac 
ttaactcaaa 
gtaattccat 
gagtagagac 
cttagtttac 



atttttctat 
tatggtaaaa 
gtcttcatgt 
ctgttaactt 
gccaatttta 
agacatttct 
ggaactacca 
tgaattttta 
agttctagtt 
ttgtttgtat 
tcatatcatg 
tgg 



taccttgcta 
tagagaaggt 
gacctgcagt 
cttcctgatg 
actgctgtga 
aatttattgc 
tcttttattc 
tacatggcat 
ctagtctgtt 
aaatatgcct 
gccttttaaa 



ccaaacagtt 
ttgaaggttt 
attttttttt 
gaatttattt 
aaatgtttcc 
ttattacttt 
ttaataatta 
acatttttct 
gatctgcctt 
ggattttcat 
tattgtaata 



tagatagcaa 
gagttactct 
ctaatgtatt 
tctgcaagaa 
agtgcaagag 
cttaatttta 
ttaatccctt 
agttccttct 
ttgttctccc 
tataaaaatg 
aaggcaaata 



<210> 3 

<211> 616 

<212> PRT 

<213> Homo sapiens 



2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3263 



<4O0> 3 



Met 


Asn 


Ser 


Pro 


Gly 


Gly 


Arg 


Gly 


1 








5 








Ser 


Asn 


Pro 


Val 


Pro 


Pro 


Arg 


Pro 








20 










Pro 


Pro 


Ala 


Ala 


Gly 


Pro 


Ala 


Pro 






"3 C 

35 










40 


Asn 


Leu 


Tyr 


Tyr 


Phe 


Ser 


Tyr 


Pro 




C ft 

50 










55 




Arg 


Leu 


Val 


Ala 


Phe 


His 


Leu 


Gly 


65 










. 10 






Arg 


Phe 


Ser 


Arg 


Ala 


Leu 


Met 


Ala 










85 








Pro 


Ala 


Pro 


Ala 


Ser 


Ala 


Ser 


Ala 








100 










Ala 


Glu 


Arg 


Val 


Arg 


Val 


Phe 


His 






115 










120 


He 


Ala 


Leu 


Arg 


He 


Asp 


Glu 


Asp 




130 










135 




Ala 


Val 


Glu 


Trp 


Tyr 


Lys 


Lys 


Gly 


145 










150 






Ala 


Val 


lie 


Val 


Thr 


Gly 


Gin 


Gly 










165 








Leu 


Gin 


Ala 


Lys 


Met 


Met 


Thr 


Asn 








180 










Gin 


Leu 


Leu 


Glu 


Lys 


Met 


Gin 


Pro 






195 










200 


Thr 


Asp 


Val 


Tyr 


Asn 


Asp 


Ser 


Thr 




210 










215 




Leu 


Gin 


Ser 


Glu 


Ser 


Gly 


Ala 


Val 


225 










230 






His 


Thr 


Ser 


Asn 


Ser 


Leu 


Pro 


Arg 










245 








Ser 


Ala 


Gly 


Leu 


Ser 


Gly 


His 


His 








260 










Ser 


Met 


Val 


Ser 


Giy 


Val 


Lys 


Gin 






275 










280 


His 


Lys 


Gly 


Thr 


Pro 


Lys 


Thr 


Asn 




290 










295 





Lys 


Lys 


Lys 


Gly 


Ser 


Gly 


Gly Ala 




10 










15 




Pro 


Pro 


Pro 


Cys 


Leu 


Ala 


Pro 


Ala 


o ft 
ZD 
















Pro 


Pro 


Glu 


A V 

Ser 


Pro 


His 


Lys 


Arg 










A C 








Leu 


Phe 


Val 


Gly 


Phe 


Ala 


Leu 


Leu 








60 










Leu 


Leu 


Phe 


Val 


Trp 


Leu 


Cys 


Gin 






75 










80 


Ala 


Lys 


Arg 


Ser 


Ser 


Gly 


Ala 


Ala 




90 










95 




Pro 


Ala 


Pro 


Val 


Pro 


Gly 


Gly. Glu 


105 










110 






Lys 


Gin 


Ala 


Phe 


Glu 


Tyr 


He 


Ser 










125 








Glu 


Lys 


Ala 


Gly 


Gin 


Lys 


Glu 


Gin 








140 










He 


Glu 


Glu 


Leu 


Glu 


Lys 


Gly 


He 






155 










160 


Glu 


Gin 


Cys 


Glu 


Arg 


Ala 


Arg 


Arg 




170 










175 




Leu 


Val 


Met 


Ala 


Lys 


Asp 


Arg 


Leu 


185 










190 






Val 


Leu 


Pro 


Phe 


Ser 


Lys 


Ser 


Gin 










205 








Asn 


Leu 


Ala 


Cys 


Arg 


Asn 


Gly 


His 








220 










Pro 


Lys 


Arg 


Lys 


Asp 


Pro 


Leu 


Thr 






235 










240 


Ser 


Lys 


Thr 


Val 


Met 


Lys 


Thr 


Gly 




250 










255 




Arg 


Ala 


Pro 


Ser 


Tyr 


Ser 


Gly 


Leu 


265 










270 






Gly 


Ser 


Gly 


Pro 


Ala 


Pro 


Thr 


Thr 










285 








Arg 


Thr 


Asn 


Lys 


Pro 


Ser 


Thr 


Pro 



300 
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Thr 


Thr Ala 


Thr Arg 


Lys 


Lys 


Lys 


Asp 


Leu 


Lys Asn Phe Arg Asn 


Val 


305 








310 










315 




320 


Asp 


Ser Asn 


Leu 


Ala 


Asn 


Leu 


He 


Met 


Asn 


Glu He Val Asp 


Asn 


Gly 






325 










330 




335 




Thr 


Ala Val 


Lys 


Phe Asp Asp 


He 


Ala 


Gly Gin Asp Leu Ala 


Lvs 


Gin 






340 










345 




350 






Ala 


Leu Gin 


Glu 


He 


Val 


He 


Leu 


Pro 


Ser 


Leu Arg Pro Glu 


Leu 


Phe 




355 










360 






365 






Thr 


Gly Leu 


Arg Ala 


Pro 


Ala 


Arg 


Gly 


Leu 


Leu Leu Phe Gly 


Pro 


Pro 




370 








375 








380 






Glv 


Asn Gly 


Lys 


Thr 


Met 


Leu 


Ala 


Lys 


Ala 


Val Ala Ala Glu 


Ser 


Asn 


385 








390 










395 




400 


Ala 


Thr Phe 


Phe 


Asn 


He 


Ser 


Ala 


Ala 


Ser 


Leu Thr Ser Lys 


Tyr 


Val 








405 










410 




415 




Gly 


Glu Gly 


Glu 


Lys 


Leu Val Arg Ala 


Leu 


Phe Ala Val Ala Arg 


Glu 




420 










425 




430 






Leu 


Gin Pro 


Ser 


He 


He 


Phe 


He Asp Glu Val Asp Ser Leu 


Leu 


Cys 




435 










440 






445 






Glu 


Arg Arg 


Glu 


Gly 


Glu 


His 


Asp 


Ala 


Ser Arg Arg Leu Lys 


Thr 


Glu 




450 








455 








460 






Phe 


Leu He 


Glu 


Phe Asp Gly Val 


Gin 


Ser 


Ala Gly Asp Asp Arg 


Val 


465 








470 










475 




480 


Leu 


Val Met 


Gly Ala 


Thr Asn Arg 


Pro 


Gin 


Glu Leu Asp Glu 


Ala 


Val 








485 










490 




495 




Leu 


Ara Ara 


Phe 


He 


Lys 


Arg 


Val 


Tyr 


Val 


Ser Leu Pro Asn 


Glu 


Glu 






500 










505 




510 






Thr 


Arg Leu 


Leu 


Leu 


Leu 


Lys 


Asn 


Leu 


Leu 


Cys Lys Gin Gly Ser 


Pro 




515 










520 






525 






Leu 


Thr Gin 


Lys 


Glu 


Leu 


Ala 


Gin 


Leu Ala Arg Met Thr Asp Gly Tyr 




530 






535 








540 






Ser 


Gly Ser 


Asp 


Leu 


Thr 


Ala 


Leu 


Ala 


Lys 


Asp Ala Ala Leu Gly 


Pro 


545 




550 










555 




560 


He 


Arg Glu 


Leu 


Lys 


Pro 


Glu 


Gin 


Val 


Lys 


Asn Met Ser Ala 


Ser 


Glu 






565 










570 




575 




Met 


Arg Asn 


He 


Arg 


Leu 


Ser Asp 


Phe 


Thr 


Glu Ser Leu Lys 


Lys 


He 




580 










585 




590 






Lys 


Arg Ser 


Val 


Ser 


Pro 


Gin 


Thr 


Leu 


Glu 


Ala Tyr lie Arg 


Trp 


Asn 


595 










600 






605 






Lys 


Asp Phe 


Gly Asp Thr Thr Val 














610 








615 















<210> 4 
<211> 23 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 4 

cggagctcct cttggctgcc atg 

<210> 5 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
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<400> 5 

agaagcgctg gcagagccac acgaag 



26 



<210> 6 
<211> 27 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 6 

aaggcgacca aacgcagcag cgcgaag 27 

<210> 7 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 8 
<211> 27 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 8 

tggttatggc caaggaccgc ttacaac 27 

<210> 9 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 10 
<211> 25 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 10 

ttaggaatgt ggacagcaac cttgc 25 
<210> 11 
<211> 25 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 7 

aggagcaagc tgtggaatgg tataag 



26 



<400> 9 



caaacggacg tctataatga cagtac 



26 
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<400> 11 

ctcctctgag gcctgagttg ttcac 25 

<210> 12 
<211> 27 
<212> ADN 

<r213> Artificial Sequence 

<2'0> 

" ?3> Amorce 

n 2 

g actgatggat actcagg 27 



.icial Sequence 
Amorce 
> 13 

—cagca ctgggtccta tccg 24 

v.- 14 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 14 

atgaacgtca tcggctacag aaacag 26 

<210> 15 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 15 

tagcagtggc tgccgccgt 19 
<210> 16 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 16 

aagcggtcct tggccataac 20 

<210> 17 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



WO 01/18198 
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<400> 17 

ggcggcagtg agagctgtg 19 

<210> 18 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 18 

ctagctcttt cacactgttc 20 

<210> 19 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 19 

aacaggcctt cgagtacatc 20 

<210> 20 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 20 

ctgtgaacaa ctcaggcctc 20 

<210> 21 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 21 

atgagaaagc aggacagaag 20 

<210> 22 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 22 

tgccaagtct tgaccagc 18 

<210> 23 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 





WO 01/18198 
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<400> 23 

ctacaactgc tactcgtaag 



20 



<210> 24 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 24 

cagtgctgca tcttttgcc 19 

<210> 25 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 26 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 26 

aaagctgtta ggtcacttcc 20 

<210> 27 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 28 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 28 

ctggaatact ttcatctgc 19 

<210> 29 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 25 

taggaatgtg gacagcaacc 



20 



<400> 27 

tggagatgac agagtacttg 



20 
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<400> 29 

atgaggctgt tctcaggcg 



19 



<210> 30 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 30 

gtgagccgaa ctgcacattg 20 

<210> 31 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 32 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 32 

ggaactgtag ttgagtggga 20 

<210> 33 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 33 

agatgaggct ccgacctac 19 

<210> 34 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 35 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 31 

caaagtcgac agctacagtg c 



21 



<400> 34 

aatgccacac ttgtaatctc 



20 




WO 01/18198 
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<400> 35 

tgtgaatata tcataatttg gg 



22 



<210> 36 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 36 . 

tacagcagtt ctcatgatg 19 

<210> 37 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 38 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 38 

acatttccaa tacatcccac 20 

<210> 39 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 40 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 40 

ttagaatgac tatacctgac 20 

<210> 41 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 37 

gaccaaattg gtgcatgcat g 



21 



<400> 39 

atttgtcatt tcacatgcac 



20 
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<400> 41 

tcaggttaag taagactc 



18 



<210> 42 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 42 

ttcctatcta cctagtgac 19 

<210> 43 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 44 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 44 

cctatgaaga tcctggtac 19 

<210> 45 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> . 
<223> Amorce 



<210> 46 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 46 

tctatttcac tcctgacatg 20 

<210> 47 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 43 

ttttatagca agttgccctg 



20 



<400> 45 

tgtcatgatt ctaacaaggg 



20 




WO 01/18198 
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44 



<400> 47 

gtcatagggc ttaggcttc 



19 



<21C 48 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 48 

atcatactac ccacttttcc 20 

<210> 49 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 50 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 50 

ctactgaaga taacgtacat g 21 

<210> 51 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210>52 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 52 

agaaggccag aaatactcag 20 

<210> 53 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 49 

tgtttgggaa gatgctactg 



20 



<400> 51 

cattgattgc catgtattgg 



20 
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<400> 53 

gtacttaaat cggtaaatat gg 



22 



<210> 54 
<211> 20 
<212> ADN 

<213> /Artificial Sequence 
<220> 

<223> Amorce 
<400> 54 

-.aagtctt aggaatgcag 20 



<210> 56 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 56 

ctcagatgac tcacatagc 19 

<210> 57 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 58 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 58 

cagattcaag aagacagatc 20 

<210> 59 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



Sequence 



- 55 

-Lcttaacc aggctgtatg 



20 



<400> 57 

ctttactaga ctaattctcc tg 



22 



WO 01/18198 
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<400> 59 

gcaataattc accacacttg 20 

<210> 60 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 60 

ggtagttctt gtttctgctc 20 

<210> 61 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 61 

caagtgtggt gaattattgc 20 

<210> 62 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 62 

gagctgaaaa gtattcagc 19 

<210> 63 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 63 

tgcaaaggac atagccagtg 20 

<210> 64 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 64 

agcctctgga gatagtatgc 20 

<210> 65 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
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<400> 65 

ctagaacagg ggtcacagtc 



20 



<210> 66 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 66 

ttggacttct taaacttc 18 

<210> 67 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 68 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 68 

ggcctgtaat tttcttctg 19 

<210> 69 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 70 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 70 

gtgtagcaga tcaacatag 19 

<210> 71 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 67 

gcagtatgca agaaattgaa c 



21 



<400> 69 

gtactgaata gatacatgta g 



21 
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<400> 71 

catcttcaag tttggtgcac 

<210> 72 
<211> 1689 
<212> ADN 

<213> Mus musculus 
<220> 

<223> ADN Spg4 incomplet. 



20 



<400> 72 

aggccgagag 

gcatcgacga 

gtatcgaaga 

aaagagctag 

tacaacttct 

ataacgagag 

ttccgaagag 

tcctgaaaag 

tgtccatggt 

ctccaaaacc 

aagacttgaa 

ttgttgacaa 

aagcgctgca 

gagctcctgc 

ctaaagcagt 

cttcaaaata 

aacttcaacc 

aaggggagca 

tgcaatctgc 

ttgatgaagc 

agacaagact 

aagaactcgc 

tggccaagga 

tgtctgccag 

taaaacgcag 

gagacaccac 

aggaaacaag 

tcatttttgt 

tatgaatgg 



cgtccgcgtc 
ggaagagaaa 
actggaaaaa 
acgtcttcaa 
agagaagctg 
tactaacctg 
gaaagacccc 
tggctccgca 
ttctggagca 
aaatagaacc 
aaattttagg 
tgggacagct 
ggagattgtc 
tagaggcttg 
agctgcagag 
tgtgggagaa 
atctataatt 
cgacgctagc 
tggagatgac 
tgttctcagg 
ccttctgctt 
acagcttgct 
tgcagccctg 
tgagatgaga 
tgtgagtcct 
tgtttaaagg 
agctttggct 
gcaccaaact 



ttccacaagc 
gcaggacaga 
ggaatcgctg 
gccaaaatga 
caaccagttt 
acatgccgca 
ttaacacatg 
gggctctccg 
agaccgggac 
aacaaacctt 
aatgtggaca 
gttaagtttg 
atccttcctt 
ttactcttcg 
tctaatgcga 
ggagagaaat 
tttatagatg 
agacggctaa 
agagtacttg 
cgtttcatta 
aaaaacctgt 
agaatgaccg 
ggtcctatcc 
aatattcgat 
cagaccttag 
aatggatgcc 
acaggaaccc 
tgaagaggaa 



aggccttcga 
aggaacaagc 
ttatagttac 
tgactaattt 
tgcaattttc 
atggacatct 
ctagtaattc 
gtcaccacag 
ctggtcctgc 
ctactcccac 
gcaatcttgc 
atgacatagc 
ctctgcggcc 
gtccgccagg 
cctttttcaa 
tggtgagagc 
aagttgacag 
agacggaatt 
taatgggtgc 
aacgggtata 
tgtgtaaaca 
atggatactc 
gagaactgaa 
tatctgactt 
aagcatacat 
tctgtgagcc 
agacttcgtt 
caagaagaca 



gtacatctcc 
tgtggaatgg 
gggccaaggt 
agttatggcc 
caagtcacag 
ccagtcagaa 
attgcctcga 
ggcgcctagt 
agctaccaca 
aactgcagtt 
taaccttata 
cgggcaggag 
tgagttgttc 
aaacggaaaa 
cataagtgct 
tctctttgct 
tcttttgtgt 
tttaatagaa 
aactaacagg 
tgtgtcctta 
aggaagtcca 
tggaagtgat 
gccagagcag 
cacagaatcc 
acgctggaac 
catagaacat 
tacaggacgt 
gacctaaata 



attgccctgc 
tataagaaag 
gaacagtatg 
aaggaccgtt 
acggacgtct 
agtggagcag 
tcaaaaactg 
tgcagtggtt 
cataagggta 
cggaaaaaga 
atgaatgaaa 
ctggcaaagc 
acagggctca 
acaatgctgg 
gccagtttaa 
gtggctcgag 
gagagacggg 
tttgacgggg 
ccccaagagc 
ccaaatgagg 
ctgacccaaa 
ctgaccgctt 
gtgaagaata 
ttaaaaaaga 
aaggattttg 
cgcacttcac 
tttagagttt 
aaatatgcaa 



<210> 73 
<211> 504 
<212> PRT 

<213> Mus musculus 
<220> 

<223> Spastin murine incomplete. 
<400> 73 

Ala Glu Ser Val Arg Val Phe His Lys Gin Ala Phe Glu Tyr lie Ser 

1 5 10 15 

lie Ala Leu Arg lie Asp Glu Glu Glu Lys Ala Gly Gin Lys Glu Gin 

20 25 30 

Ala Val Glu Trp Tyr Lys Lys Gly lie Glu Glu Leu Glu Lys Gly lie 

35 40 45 

Ala Val He Val Thr Gly Gin Gly Glu Gin Tyr Glu Arg Ala Arg Arg 

50 55 60 

Leu Gin Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu 
65 70 75 80 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1689 
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Gin Leu Leu Glu Lys Leu Gin Pro Val Leu Gin Phe Ser Lys Ser Gin 

85 90 95 

Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His 

100 105 110 

Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr 

115 120 125 

His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly 

130 135 140 

Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu 
145 150 155 160 

Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr 

165 170 175 

His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro 

180 185 190 

Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val 

195 200 205 

Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu lie Val Asp Asn Gly 

210 215 220 

Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gin Glu Leu Ala Lys Gin 
225 230 235 240 

Ala Leu Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe 

245 250 255 

Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro 

260 265 270 

Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn 

275 280 285 

Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val 

290 295 300 

Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu 
305 310 315 320 

Leu Gin Pro Ser lie He Phe He Asp Glu Val Asp Ser Leu Leu Cys 

325 330 335 

Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu 

340 345 350 

Phe Leu He Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val 

355 360 365 

Leu Val Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val 

370 375 380 

Leu Arg Arg Phe He Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu 
385 390 395 400 

Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro 

405 410 415 

Leu Thr Gin Lys Glu Leu Ala Gin Leu Ala Arg Met Thr Asp Gly Tyr 

420 425 430 

Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro 

435 440 445 

He Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu 

450 455 460 

Met Arg Asn He Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys He 
465 470 475 480 

Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr He Arg Trp Asn 

485 490 495 

Lys Asp Phe Gly Asp Thr Thr Val 



500 



<210> 74 
<211> 24 
<212> ADN 



<213> Homo sapiens 
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50 

<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 74 

attttttatt ttaaagcagg acag 

<210> 75 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 75 

aatttttttc tttcaggtga acag 

<210>* 76 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 76 

cttctctgtt gcatagagaa gatg 

<210> 77 

<211> 24 

<212> ADN* 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 77 

actttttcct tgtcagaaag tgga 

<210> 78 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 78 

ttttgtatcc tttaagggta ctcc 

<210> 79 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 79 

aggtcttgtt tcttagtgga acag 

<210> 80 
<211> 24 
<212> ADN 




PCT/FR00/02433 



24 



24 



24 



24 



24 
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<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 80 

agtatatatt ttttagttgt tcac 

<210> 81 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 81 

cttgtgattt ttaaaggcta aagc 

<210> 82 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 82 

taatgctttg ttttaggtgg gaga 

<210> 83 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 83 

cttgtatttc ctctagatga agtt 

<210> 84 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 84 

gattttttgc ttgtaggtac agtc 

<210> 85 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 85 

ggattttttt ttttaggcgt ttca 



<210> 86 



V'O 01/18198 PCT/FROO/02433 

52 

<21I> 24 
<2U> ADN 

<21Z> Homo sapiens 

<220> 

<22i> Site accepteur d'epissage du gene SPG4 . 

<i'.*j> 86 

:t; ,aatatt . tttcagacaa gact 24 

■ 0> 87 
■>.1> 24 
!> ADN 

> Homo sapiens 

Site accepteur d'epissage du gene SPG4 . 
37 

^ctt cctcagaatg actg 24 

• > 38 
24 
\DN 

Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 88 

cttttatgtt ttacagaact aaaa 24 

<210> 89 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 89 

ctttttaaaa atctagatga gaaa 24 

<210> 90 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 90 

tgagaaaggt aactaggggg ctgg 24 

<210> 91 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 



<400> 91 

aggacaaggt aagattgtat ttgt 



24 




WO 01/18198 



<210> 92 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 
<400> 92 

acttctaggt atcaattaat gtat 

<210> 93 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 
<400> 93 

ccagtcaggt gggtttaggt taac 

<210> 94 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 
<400> 94 

ctcataaggt attctgggac agta 

<210> 95 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 
<400> 95 

gtggacaagt aagttttgcc atct 

<210> 96 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 
<400> 96 

ggcctgaggt aagaacttta tatt 
<210> 97 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene 




PCT/FROO/02433 

53 
SPG4. 

24 

SFG4. 

24 

SPG4. 

24 

SPG4. 

24 

SPG4. 

24 

SPG4 . 



<400> 97 

caatgctggt aagggttctc ttca 



24 
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<210> 98 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 98 

caaaatacgt gagtgctctg tttc 

<210> 99 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 99 

ttttataggt aagaacatat tttc 

<210> 100 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 100 

ttgatggtgt aagtgttgat tatg 

<210> 101 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 101 

gttctcaggt agggagattt atat 

<210> 102 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 102 

atgaggaggt atgtatctgt gttt 

<210> 103 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 103 

cttgctaggt gagtaatttg gatt 



WO 01/18198 
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<210> 104 

<211> 24 

<212> AON 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du 
<400> 104 

tatccgaggt aggtatacaa gage 

<210> 105 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du 
<400> 105 

ccagtgaggt atagtatttt acaa 

<210> 106 

<211> 2152 

<212> ADN 

<213> Mus musculus 

<220> 

<223> ADN Spg4 complet 
<400> 106 

gctcccgggc tccggcgggc gegegagegg 
tggccgccgc cgccgcttgg tcgccgtcgg 
cagtgggagc tgtgaatgag ttctccggcc 
gcgagcccgg cgcccgccag gcctccgccc 
ccggcccctg cggccggctc gccgcctaag 
gtegtegget tcgccctgct gcgcctgctg 
ctctgccagc gcttctcccg cgccctcatg 
gcgcccgcct cgccctcgcc cccagcgccc 
gtcttccaca ageaggcett cgagtacatc 
aaagcaggac agaaggaaca agctgtggaa 
aaaggaatcg ctgttatagt tacgggccaa 
caagecaaaa tgatgactaa tttagttatg 
ctgcaaccag ttttgeaatt ttccaagtca 
ctgacatgcc gcaatggaca tctccagtca 
cccttaacac atgctagtaa ttcattgect 
gcagggctct ccggtcacca cagggcgcct 
geaagacegg gacctggtcc tgcagctacc 
accaacaaac cttctactcc cacaactgca 
aggaatgtgg acagcaatct tgetaacett 
gctgttaagt ttgatgacat ageegggcag 
gtcatccttc cttctctgcg gcctgagttg 
ttgttactct tcggtccgcc aggaaaegga 
gagtctaatg cgaccttttt caacataagt 
gaaggagaga aattggtgag agctctcttt 
atttttatag atgaagttga cagtcttttg 
ageagaegge taaagacgga atttttaata 
gacagagtac ttgtaatggg tgcaactaac 
aggegtttea ttaaacgggt atatgtgtcc 
cttaaaaacc tgttgtgtaa acaaggaagt 
gctagaatga ccgatggata ctctggaagt 
ctgggtccta tccgagaact gaagecagag 



55 



gene SPG4. 



24 



gene SPG4 . 



24 



ctccgtgggc ccccgccgcc gcagtggcag 60 
tetgegggaa gcgggttatg geggeggegg 120 
ggacgacgga agaagaaagg ctcgggcggc 180 
cccgccgcgg tccccgcccc tgccgccggc 240 
eggaacctgt cttctttctc gtccccgctg 300 
gcctgccacc tggggctcct cttcgcgtgg 360 
gccgccaaga ggagctcegg gaccgcgccg 420 
ggaccgggtg gegaggcega gagcgtccgc 480 
tccattgccc tgegcatega cgaggaagag 540 
tggtataaga aaggtatcga agaactggaa 600 
ggtgaacagt atgaaagagc tagaegtett 660 
gccaaggacc gtttacaact tctagagaag 720 
cagaeggacg tctataacga gagtactaac 780 
gaaagtggag cagttccgaa gaggaaagac 840 
cgatcaaaaa ctgtcctgaa aagtggctcc 900 
agttgcagtg gtttgtccat ggtttctgga 960 
acacataagg gtactccaaa accaaataga 1020 
gttcggaaaa agaaagactt gaaaaatttt 1080 
ataatgaatg aaattgttga caatgggaca 1140 
gagctggcaa ageaageget gcaggagatt 1200 
ttcacagggc tcagagctcc tgetagagge 1260 
aaaacaatgc tggctaaagc agtagctgea 1320 
getgecagtt taacttcaaa atatgtggga 1380 
gctgtggctc gagaacttca accatctata 1440 
tgtgagagac gggaagggga gcacgacgct 1500 
gaatttgacg gggtgcaatc tgctggagat 1560 
aggccccaag agcttgatga agctgttctc 1620 
ttaccaaatg aggagacaag actccttctg 1680 
ccactgaccc aaaaagaact cgcacagctt 1740 
gatctgaccg ctttggccaa ggatgeagee 1800 
caggtgaaga atatgtctgc cagtgagatg 1860 
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agaaatattc gattatctga cttcacagaa tccttaaaaa agataaaacg cagtgtgagt 1920 
cctcagacct tagaagcata catacgctgg aacaaggatt ttggagacac cactgtttaa 1980 
aggaatggat gcctctgtga gcccatagaa catcgcactt cacaggaaac aagagctttg 2040 
gctacaggaa cccagacttc gtttacagga cgttttagag ttttcatttt tgtgcaccaa 2100 
acttgaagag gaacaagaag acagacctaa ataaaatatg caatatgaat gg 2152 



<210> 107 

<211> 614 

<212> PRT 

<213> Mus mus cuius 

<220> 

<223> Spastin murine complete 



<400> 107 



Met 


Ser 


Ser 


Pro 


1 








Ser 


Pro 


Ala 


Pro 








20 


Ala 


Ala 


Glv 


Pro 






35 




Ser 


Ser 


Phe 


Ser 




50 






Leu 


Ala 


Cvs 


His 


65 








Ser 


Arg 


Ala 


Leu 


Pro 


Ala 


Ser 


Pro 








100 


Ser 


Val 


Arg 


Val 






115 




Leu 


Arg 


He 


Aso 




130 






Glu 


TrD 


Tvr 


Lvs 


145 








He 


Val 


Thr 


Gly 


Ala 


Lys 


Met 


Met 








180 


Leu 


Glu 


Lys 


Leu 






195 




Val 


Tyr 


Asn 


Glu 




210 






Ser 


Glu 


Ser 


Gly 


225 








Ser 


Asn 


Ser 


Leu 


Gly 


Leu 


Ser 


Gly 








260 


Val 


Ser 


Gly 


Ala 






275 




Gly 


Thr 


Pro 


Lys 




290 






Ala 


Val 


Arg 


Lys 


305 








Asn 


Leu 


Ala 


Asn 


Val 


Lys 


Phe 


Asp 



340 



Ala 


Glv 


Ara 


Ara 


5 








Ala 


Arg 


Pro 
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